2011-01-01から1年間の記事一覧

ゲノム座標の記法(1-based vs. 0-based)

先日、後輩から「UCSCからダウンロードした遺伝子の座標から塩基配列を取得するときに、ファイルに書かれた座標とゲノムブラウザでみた配列が1つずれてる」と言われました。 自分もかつて同じ問題にぶつかったのですが、意外と知らない人がいると思い、まと…

SAMフォーマットの注意点

あんまり需要はない知識ですが、SAMファイルをSAMToolsなどを使わずに直接いじくったときに引っかかったことをメモ。The SAM Format Specification (v1.4-r962)(pdf) multiread(複数の箇所にマップされたリード)を除きたい場合 あるリードが複数の箇所にマッ…

RefSeq

The Reference Sequence (RefSeq) database is a non-redundant collection of richly annotated DNA, RNA, and protein sequences from diverse taxa. The collection includes sequences from plasmids, organelles, viruses, archaea, bacteria, and euka…

Entrez Gene と RefSeq の関係

Entrez Gene は「遺伝子の辞書」 Entrez Gene は、遺伝子を中心に据えて*1、ゲノム地図、配列、発現、タンパク質構造、機能、相同性といった多様な情報を統合したデータベースです。すべてをまとめる、というよりは色んなところに飛んでいけるハブを提供する…