Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Database: The Journa...arrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
Database: The Journal of Biological Databases and Curation
Article . 2014 . Peer-reviewed
License: CC BY
Data sources: Crossref
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
PubMed Central
Article . 2014
License: CC BY
Data sources: PubMed Central
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
https://dx.doi.org/10.60692/mf...
Other literature type . 2014
Data sources: Datacite
https://dx.doi.org/10.60692/b2...
Other literature type . 2014
Data sources: Datacite
DBLP
Article . 2014
Data sources: DBLP
versions View all 12 versions
addClaim

Text-mining-assisted biocuration workflows in Argo

مهام سير عمل التكيّف الحيوي بمساعدة التنقيب عن النصوص في ARGO
Authors: Rafał Rak; Riza Batista-Navarro; Andrew Rowley; Jacob Carter; Sophia Ananiadou;
APC: 1,172.64 EUR

Text-mining-assisted biocuration workflows in Argo

Abstract

Les activités de biocuration ont été largement classées dans la sélection des documents pertinents, l'annotation des concepts biologiques d'intérêt et l'identification des interactions entre les concepts. Il a été démontré que l'exploration de texte avait le potentiel de réduire considérablement l'effort des biocurateurs dans les trois activités, et diverses méthodologies semi-automatiques ont été intégrées dans les pipelines de curation pour les soutenir. Nous étudions la pertinence d'Argo, un atelier pour la construction de solutions d'exploration de texte à l'aide d'une interface utilisateur graphique riche, pour le processus de biocuration. Les flux de travail personnalisables que les utilisateurs composent en organisant les analyses élémentaires disponibles pour former des unités de traitement spécifiques aux tâches sont au cœur d'Argo. Un éditeur d'annotations manuel intégré est l'outil de biocuration le plus utilisé de l'atelier, car il permet aux utilisateurs de créer des annotations directement dans le texte, ainsi que de modifier ou de supprimer des annotations créées par des composants de traitement automatique. Outre l'analyse syntaxique et sémantique, la bibliothèque de composants en constante expansion comprend plusieurs lecteurs de données et consommateurs qui prennent en charge des formats d'échange de données bien établis et émergents tels que XMI, RDF et BioC, qui facilitent l'interopérabilité d'Argo avec d'autres plates-formes ou ressources. Pour valider l'adéquation d'Argo aux activités de conservation, nous avons participé au défi BioCreative IV dont le but était d'évaluer les systèmes basés sur le Web répondant aux tâches de biocuration définies par l'utilisateur. Argo s'est avéré avoir l'avantage sur les autres systèmes en termes de flexibilité dans la définition des tâches de biocuration. Comme prévu, la polyvalence de l'atelier a inévitablement allongé le temps que les conservateurs ont passé à apprendre le système avant d'assumer la tâche, ce qui a peut-être affecté la convivialité d'Argo. La participation au défi nous a donné l'occasion de recueillir des commentaires précieux et d'identifier les domaines d'amélioration, dont certains ont déjà été introduits. URL de la base de données : http://argo.nactem.ac.uk.

Las actividades de biocuraduría se han categorizado ampliamente en la selección de documentos relevantes, la anotación de conceptos biológicos de interés y la identificación de interacciones entre los conceptos. Se ha demostrado que la minería de textos tiene el potencial de reducir significativamente el esfuerzo de los biocuradores en las tres actividades, y se han integrado varias metodologías semiautomáticas en los procesos de curación para apoyarlas. Investigamos la idoneidad de Argo, un banco de trabajo para la construcción de soluciones de minería de texto con el uso de una rica interfaz gráfica de usuario, para el proceso de biocuración. Central para Argo son flujos de trabajo personalizables que los usuarios componen organizando los análisis elementales disponibles para formar unidades de procesamiento específicas de la tarea. Un editor de anotaciones manual incorporado es la herramienta de biocurado más utilizada del banco de trabajo, ya que permite a los usuarios crear anotaciones directamente en el texto, así como modificar o eliminar anotaciones creadas por componentes de procesamiento automático. Además de la analítica sintáctica y semántica, la creciente biblioteca de componentes incluye varios lectores de datos y consumidores que admiten formatos de intercambio de datos bien establecidos y emergentes, como XMI, RDF y BioC, que facilitan la interoperabilidad de Argo con otras plataformas o recursos. Para validar la idoneidad de Argo para las actividades de curaduría, participamos en el desafío BioCreative IV cuyo propósito era evaluar sistemas basados en la web que abordaran tareas de biocuraduría definidas por el usuario. Argo demostró tener la ventaja sobre otros sistemas en términos de flexibilidad para definir las tareas de biocurado. Como era de esperar, la versatilidad del banco de trabajo inevitablemente alargó el tiempo que los curadores dedicaron al aprendizaje del sistema antes de asumir la tarea, lo que puede haber afectado la usabilidad de Argo. La participación en el desafío nos dio la oportunidad de recopilar comentarios valiosos e identificar áreas de mejora, algunas de las cuales ya se han introducido. URL de la base de datos: http://argo.nactem.ac.uk.

Biocuration activities have been broadly categorized into the selection of relevant documents, the annotation of biological concepts of interest and identification of interactions between the concepts. Text mining has been shown to have a potential to significantly reduce the effort of biocurators in all the three activities, and various semi-automatic methodologies have been integrated into curation pipelines to support them. We investigate the suitability of Argo, a workbench for building text-mining solutions with the use of a rich graphical user interface, for the process of biocuration. Central to Argo are customizable workflows that users compose by arranging available elementary analytics to form task-specific processing units. A built-in manual annotation editor is the single most used biocuration tool of the workbench, as it allows users to create annotations directly in text, as well as modify or delete annotations created by automatic processing components. Apart from syntactic and semantic analytics, the ever-growing library of components includes several data readers and consumers that support well-established as well as emerging data interchange formats such as XMI, RDF and BioC, which facilitate the interoperability of Argo with other platforms or resources. To validate the suitability of Argo for curation activities, we participated in the BioCreative IV challenge whose purpose was to evaluate Web-based systems addressing user-defined biocuration tasks. Argo proved to have the edge over other systems in terms of flexibility of defining biocuration tasks. As expected, the versatility of the workbench inevitably lengthened the time the curators spent on learning the system before taking on the task, which may have affected the usability of Argo. The participation in the challenge gave us an opportunity to gather valuable feedback and identify areas of improvement, some of which have already been introduced. Database URL: http://argo.nactem.ac.uk.

تم تصنيف أنشطة المعالجة الحيوية على نطاق واسع في اختيار الوثائق ذات الصلة، والتعليق التوضيحي للمفاهيم البيولوجية ذات الأهمية وتحديد التفاعلات بين المفاهيم. وقد ثبت أن التنقيب عن النصوص لديه القدرة على الحد بشكل كبير من جهود المشرفين البيولوجيين في جميع الأنشطة الثلاثة، وقد تم دمج العديد من المنهجيات شبه الآلية في خطوط أنابيب التنظيم لدعمها. نقوم بالتحقيق في مدى ملاءمة Argo، وهي طاولة عمل لبناء حلول التنقيب عن النصوص باستخدام واجهة مستخدم رسومية غنية، لعملية المعالجة الحيوية. من الأمور المركزية في Argo هي سير العمل القابل للتخصيص الذي ينشئه المستخدمون عن طريق ترتيب التحليلات الأولية المتاحة لتشكيل وحدات معالجة خاصة بالمهمة. يعد محرر التعليقات التوضيحية اليدوي المدمج أكثر أدوات المعالجة الحيوية استخدامًا في طاولة العمل، حيث يسمح للمستخدمين بإنشاء تعليقات توضيحية مباشرة في النص، بالإضافة إلى تعديل أو حذف التعليقات التوضيحية التي تم إنشاؤها بواسطة مكونات المعالجة التلقائية. بصرف النظر عن التحليلات النحوية والدلالية، تتضمن مكتبة المكونات المتنامية باستمرار العديد من قارئات البيانات والمستهلكين الذين يدعمون تنسيقات تبادل البيانات الراسخة والناشئة مثل XMI و RDF و BioC، والتي تسهل قابلية التشغيل البيني لـ ARGO مع المنصات أو الموارد الأخرى. للتحقق من ملاءمة ARGO لأنشطة التنظيم، شاركنا في تحدي BioCreative IV الذي كان الغرض منه تقييم الأنظمة المستندة إلى الويب التي تتناول مهام التكثيف الحيوي المحددة من قبل المستخدم. أثبتت آرغو أن لديها ميزة على الأنظمة الأخرى من حيث المرونة في تحديد مهام التكثيف الحيوي. كما هو متوقع، أدى تعدد استخدامات طاولة العمل حتماً إلى إطالة الوقت الذي يقضيه القيمون على تعلم النظام قبل تولي المهمة، مما قد يؤثر على قابلية استخدام Argo. منحتنا المشاركة في التحدي فرصة لجمع ملاحظات قيمة وتحديد مجالات التحسين، والتي تم تقديم بعضها بالفعل. رابط قاعدة البيانات: http://argo.nactem.ac.uk.

Country
United Kingdom
Keywords

Time Factors, Information Systems and Management, Scientific Workflows, Text Mining, Biomedical Ontologies and Text Mining, Social Sciences, Library science, Oceanography, Decision Sciences, Workflow, Data science, Database, User-Computer Interface, Artificial Intelligence, Biochemistry, Genetics and Molecular Biology, Data Mining, Humans, Information retrieval, Molecular Biology, Data Curation, Internet, Management and Reproducibility of Scientific Workflows, Life Sciences, Molecular Sequence Annotation, Geology, FOS: Earth and related environmental sciences, Computer science, World Wide Web, Argo, Computer Science, Physical Sciences, Original Article, Software, Semantic Web and Ontology Development, Workflow Management

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    22
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Top 10%
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Top 10%
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Top 10%
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
22
Top 10%
Top 10%
Top 10%
Green
gold