transparent gif

 

Ej inloggad.

Göteborgs universitets publikationer

Strategies to improve usability and preserve accuracy in biological sequence databases

Författare och institution:
Johan Bengtsson-Palme (Institutionen för biomedicin, avdelningen för infektionssjukdomar); Fredrik Boulund (Institutionen för matematiska vetenskaper, matematisk statistik, Chalmers/GU); Robert Edström (Institutionen för data- och informationsteknik (Chalmers), Chalmers); Amir Feizi (Institutionen för biologi och bioteknik, Systembiologi, Chalmers); Anna Johnning (Institutionen för matematiska vetenskaper, Chalmers/GU); Viktor Jonsson (Institutionen för matematiska vetenskaper, Chalmers/GU); Fredrik H. Karlsson (Institutionen för biologi och bioteknik, Systembiologi, Chalmers); Chandan Pal (Institutionen för biomedicin, avdelningen för infektionssjukdomar); Mariana Buongermino Pereira (Institutionen för matematiska vetenskaper, matematisk statistik, Chalmers/GU); Anna Rehammar (Institutionen för matematiska vetenskaper, matematisk statistik, Chalmers/GU); José Sánchez (Institutionen för matematiska vetenskaper, Chalmers/GU); Kemal Sanli (Institutionen för biologi och miljövetenskap); Kaisa Thorell (Institutionen för biomedicin, avdelningen för mikrobiologi och immunologi)
Publicerad i:
Proteomics, Epub ahead of print
ISSN:
1615-9853
E-ISSN:
1615-9861
Publikationstyp:
Artikel, refereegranskad vetenskaplig
Publiceringsår:
2016
Språk:
engelska
Fulltextlänk:
Sammanfattning (abstract):
Biology is increasingly dependent on large-scale analysis, such as proteomics, creating a requirement for efficient bioinformatics. Bioinformatic predictions of biological functions rely upon correctly annotated database sequences, and the presence of inaccurately annotated or otherwise poorly described sequences introduces noise and bias to biological analyses. Accurate annotations are, for example, pivotal for correct identifications of polypeptide fragments. However, standards for how sequence databases are organized and presented are currently insufficient. Here, we propose five strategies to address fundamental issues in the annotation of sequence databases: (i) to clearly separate experimentally verified and unverified sequence entries; (ii) to enable a system for tracing the origins of annotations; (iii) to separate entries with high-quality, informative annotation from less useful ones; (iv) to integrate automated quality-control software whenever such tools exist; and (v) to facilitate post-submission editing of annotations and metadata associated with sequences. We believe that implementation of these strategies, for example as requirements for publication of database papers, would enable biology to better take advantage of large-scale data.
Ämne (baseras på Högskoleverkets indelning av forskningsämnen):
NATURVETENSKAP ->
Data- och informationsvetenskap ->
Datavetenskap (datalogi) ->
Databaser
NATURVETENSKAP ->
Biologiska vetenskaper ->
Bioinformatik och systembiologi
NATURVETENSKAP ->
Biologiska vetenskaper ->
Annan biologi ->
Funktionsgenomik
Nyckelord:
Annotation, Databases, Functional prediction, Sequencing, Standards
Postens nummer:
240559
Posten skapad:
2016-08-22 09:59
Posten ändrad:
2016-08-22 11:17

Visa i Endnote-format

Göteborgs universitet • Tel. 031-786 0000
© Göteborgs universitet 2007