No.17 - DDBJ

申込・変更
No. 17 2004年12月1日発行
Site
Search DDBJ
DDBJ Site
for
最新号
過去の号
発行:DDBJ
Go
■不思議なきのこ達 10月の終わり頃,遺伝研の片隅にきのこが生えてきました。 車のヘッド
ライトを浴びて暗闇に浮かびあがるきのこ達は妙に無口で存在感があり
ました。
隔月公開の DDBJ メールマガジン第17号 web 版です。 ご質問やご
意見は [email protected] までどうぞ。
SAKURA 大量登録
登録データ更新
■ヒトゲノム配列最新版公開 国際ヒトゲノムシーケンス決定コンソーシアムにより,ヒトゲノム配列の最新版が10月21日発行の Nature
(vol.431, pp.931-945; Oct.21, 2004) に発表されました。
ARSA
getentry
TXSearch FASTA
BLAST
SSEARCH HMMPFAM
ClustalW Web API GIB
GIB-V
GTPS
GTOP
既に同コンソーシアムは2001年にヒトゲノムを概要配列を発表し,2003年4月にヒトゲノム全配列解読完了
を宣言していましたが,今回,全配列の99%以上を決定した最新版が発表されました。この最新版の配列
を,セレラ社が決定した配列とともに DDBJ の以下のサイトから入手できます。
ヒトゲノム完成配列(Build 35.1)ダウンロードページ
参考資料として下記もご覧下さい。
- DDBJ/CIB ヒトゲノム情報工房(概要配列)
- ヒトゲノム全配列解読完了
■SEGMENT で記述されている登録データの修正 DDBJ ではこれまで,登録されたデータの配列に不明部位が含まれる場合,配列不明部位で分断されている
1つ1つの配列に対して各々アクセッション番号を発行し, SEGMENT 行に配列を構成するエントリの数と順
番を記述する形で登録していました。
DDBJ リリースノート
公開中リリース
しかし,DDBJ/EMBL/GenBank 国際塩基配列データベースの査定方針の変更に伴い,配列不明部位が
含まれる登録の場合,配列が不明な領域に "n" を挿入した1つの配列として登録することになりました。挿入
される "n" の長さは,配列の不明な領域の長さが予測される場合はその長さ分の "n" を,そして長さが予測
出来ない場合は100個の "n" とします。
DDBJ では2004年7月より上記の方針に従い登録データを受付けています。 2004年7月以前に登録された
SEGMENT で記述されているエントリにつきましても,この方針に従い,配列不明部位で分断されている1つ
講習会 関連会議
ゲノム機能発現研究会
DDBJ の連絡先 Copyright c 1995-2006
1つの配列を,配列が不明な領域に "n" を挿入した1つの配列にし,1つのエントリに集約した形に修正いた
します。集約に際しては,SEGMENT で記述されているエントリのアクセッション番号は,集約先のエントリのセ
カンダリアクセッション番号となります。また,既に公開されている登録データにつきましては,修正後のエントリを
順次公開していく予定です。
皆様のご理解とご協力をお願い致します。ご不明な点やご質問などは DDBJ update 係
([email protected])までご連絡下さい。
DDBJ All rights reserved.
SEGMENT で記述されているエントリの修正例:
集約前: D85375 D85376
集約後: D85376
SAKURA での配列不明部位のある配列の登録:
配列の不明な領域の長さが予測出来ない配列を SAKURA から登録する場合は,「登録データ種類」
で "multi-exons with unknown gaps" を選択して,配列決定された部位のみを登録して下さい。
配列不明部位に自動的に100個の "n" が挿入された形で登録されます。
参照 DDBJ Q and A:
Q.不明部位のある配列はどのように登録すればよいですか
■一部 CON エントリの修正 DDBJ/EMBL/GenBank 国際塩基配列データベースに登録する際の1エントリ当たりの配列長は,以前まで
350 kbp 以下に制限されていました。そのため,これを超える長さの配列を登録する場合には,350 kbp 以
下に分断したエントリ(ピースエントリ)として登録し,併せてピースエントリを統合する情報を CON
(Contig/Constructed) エントリとして構築し公開していました。
しかしながら,DDBJ/EMBL/GenBank 国際塩基配列データベースはこの制限を2004年6月に撤廃いたしま
した。これに伴い,過去に登録を受け付けた際,ピースエントリとして分割した配列を元の連続した配列に集約
し1エントリとして再公開を行なうことになりました。
以下の要領でピースエントリと CON エントリを集約し,1エントリに修正いたします。
CON エントリのアクセッション番号を残し,これに集約します。
ピースエントリ自体は非公開化され,そのアクセッション番号はセカンダリアクセッション番号(*)となります。
ピースエントリに記載されていた feature 情報と配列は,集約された1つのエントリに継承されます。
集約後は CON エントリではなく,各生物に対応した division に移行します。
* 修正後に getentry などの検索ツールでピースエントリのアクセッション番号を検索した場合,CON エントリの
アクセッション番号を持つ集約されたエントリが結果として返ります。 CON エントリの詳細については,こちら をご
参照ください。
■Mus musculus molossinus データの大幅な増加 マウス( Mus musculus molossinus)の登録塩基数が,DDBJ リリース59 (2004年9月)で大幅に増加
しました。 DDBJ の統計 [登録塩基数上位30種の順位推移] を見ると,リリース58 (2004年6月) では
3131 位であった登録塩基数がリリース59 では 21 位になっていることがわかります。
これは,これまでに公開されていた Mus musculus molossinus の塩基数 44,452 bp に理化学研究所ゲ
ノムサイエンスセンターにより公開された 337,471 エントリ分の塩基数が追加され,279,762,931 bp となっ
たたためです。この配列は理化学研究所バイオリソースセンター,阿部訓也博士が作成した Mus musculus
molossinus-MSM mouse BAC clone library の末端の配列であり,以下の論文でそれらのデータの詳細
が発表されます。
Abe K., Noguchi H., Tagawa K., Yuzuriha M., Toyoda A., Kojima T., Ezawa K., Saitou
N., Hattori M., Sakaki Y., Moriwaki K., and Shiroishi T. (2004) Contribution of Asian
mouse subspecies Mus musculus molossinus to genomic constitution of strain
C57BL/6J, as defined by BAC end sequence-SNP analysis. Genome Res. 2004
Dec;14(12):2439-47.
このデータのアクセッション番号は AG275743-AG613213 です。これらの配列は DDBJ の
getentry で取
得することができます。
各々の MSM BAC クローンは,寄託先である理化学研究所バイオリソースセンター遺伝子材料開発室から入
手できます。詳しくは MSM Mouse BAC clones & Library をご覧下さい。
■DDBJ 新検索システム "Shunsaku" まもなく公開 富士通製の高速 XML 型データベース検索エンジン「インターステージシュンサク(Interstage Shunsaku)」
を基盤技術として採用した,DDBJ 新キーワード検索システムのプロトタイプ版をまもなくテスト公開いたしま
す。 DDBJ/EMBL/GenBank 国際塩基配列データベースについて,DDBJ フラットファイル(flat file)形式
に沿った詳細な検索条件を指定したエントリの検索が可能となっております。また,従来と比較して高速な検索
が可能となっており,どんな複雑な検索条件や大量の検索ヒットが得られる場合においてもほぼ一定(約
5〜10秒)のスピードで検索することが可能です。
検索対象は,DDBJ 定期リリースと DDBJ 新着データです。
DDBJ フラットファイル形式に沿った詳細な検索条件を指定することができます。
検索条件に依らず,ほぼ一定(約5秒 〜10秒)の検索レスポンスが得られます。
検索結果は,フラットファイル,DDBJ-XML,FASTA の3つの形式で取得することができます。
検索結果をファイルとしてダウンロードすることができます。
■年末年始休業のおしらせ DDBJ では,国際塩基配列データベースの構築業務を 2004年12月29日(水)から2005年1月3日(月)ま
で休業いたします。
これにともない,SAKURA によるデータ受け付けは2004年12月27日(月) から 2005年1月4日(火) までご
利用いただけません。エントリの新規および再公開も,2004年12月27日から2005年1月4日まで行なわれま
せん。
皆様のご理解・ご協力をお願い申し上げます。
■日本分子生物学会にブース出展 12月8日から11日にかけて神戸で開催される第27回日本分子生物学会年会の附設展示会に DDBJ ブー
スを出展します。神戸国際展示場2号館1階341番ブースで,ポスター展示と資料の配布などを行なう予定
です。 DDBJ スタッフがご質問にお答えすることもできますので,機会がありましたらどうぞお立ち寄り下さい。
■ミレニアム・ゲノムプロジェクト成果報告会 2000年から5カ年計画で推進されていた「ミレニアム・ゲノムプロジェクト」が2005年3月で終了するにあたり,こ
れまでの研究成果報告会を東京と大阪にて開催いたします。
各研究テーマのリーダーによる研究成果報告と,第一線の研究者による講演など,ゲノム・バイオインフォマティ
クス研究の将来展望について討論する半日のシンポジウムで,国立遺伝学研究所 生命情報・DDBJ 研究セ
ンターが主催します。
東京会場(日本科学未来館):2005年1月12日(水) 13:00-16:15 参加無料
大阪会場(大阪国際会議場):2005年1月14日(金) 13:00-16:15 参加無料
詳細はこちら をご覧下さい。
■DDBJ スタッフコラム6 Medicoinformatics
鈴木 善幸
国立遺伝学研究所 遺伝情報分析研究室 助手
曲がりなりにも医師免許と少なからぬ良心を持っているつもりである者として,自分のやっていることがどうにかし
て病気の治療なり予防なりに役立ちはしないかという考えはある。というか最近そういう考えを少しだけ持つように
なった。多分齢のせいだ。私は若い頃の紆余曲折の後,分子進化学という分野に身を置かせて頂いて塩基配
列やアミノ酸配列から有用な情報を取り出すべく悪戦苦闘の日々を送っている。巷で言う所の
bioinformatics の一端である。最初のうちはとにかくひたすら面白くて,何を読んでも何をやってもただただ感
動していた。しかしながら時間が経つにつれてだんだんとちっとやそっとのことでは驚かなくなり,果ては自分は一
体何がしたかったのかとまで考えるようになってしまった。そして何と結局は当の昔に興味を失っていたはずの医学
に少しでも役に立ちたいなどと考えるようにまでなってしまったのである。といっても少しだけであるが。
そんなわけで,自分が知っている限りの bioinformatics のうちで病気の治療や予防に繋がりそうなものが一
体どれだけあるのだろうか,そしてそういう研究を集めて medicoinformatics なんて名前にでもして本でも書
こうかしらなどと時々考えてみたりする。さては誰か同じようなことを考えてるんじゃないかと Yahoo で検索してみ
ると,どうやら medicoinformatics という言葉はないらしい。しめしめ,英辞郎にもない。じゃあ日本語訳は医
療情報学?とか思ってもう一度検索してみると,何とヒットするではないか。それどころか学会まである。ここまで
か。英語表記は medical informatics あるいは medinformatics というらしい。なるほど確かに
medicoinformatics より medinformatics の方が格好いい。でもよく読むとこの medinformatics なるも
のはどうやら私が考えているようないわゆる我々が想像する bioinformatics の一部といった極めて度量の狭い
ものではなく,電子カルテだの遠隔医療だのといったものまで含んだ途轍もなくスケールの大きなもののようであ
る。やや残したか。でもまあ例え自分が考える medicoinformatics が medinformatics に含まれていたとし
てもその部分だけ medicoinformatics だと言い張ればいいか。
何気に medicoinformatics は生き残ったとしよう。じゃあその中身は何だっけ?それは bioinformatics で医
学に役立ちそうなもの。無い頭で今まで考えて行き着いた先は,まず病原性ウイルスの分子進化学的研究に
よって何かワクチンの開発に結びつくような知見が得られるんじゃないかということ。それから SNP なんかの集団
遺伝学的解析で疾患感受性遺伝子を同定することによって病気の治療法開発に役立てられるんじゃないかとい
うこと。まで。あとはない。恐らくこれだけの事でも本にしたら相当なものが出来上がるには違いない。でも自分が
やっていることが医学にこれだけしか役立たないのかと思うと何故だか微妙に嫌だし,もっと役に立つことがある筈
だという気持ちが常に自分を支配して追い詰めている。苦しい。といってもやっぱり少しだけなのだが。
そんなことを時々考えている。
[email protected]
この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。配信希望・変更・
不要の方は,画面右上の「申込み・変更」ボタンをクリックするか,次のメールアドレスまでご連絡下さい:
[email protected]
発行: 日本 DNA データバンク (DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540 静岡県三島市谷田1111
Last modified: Oct. 07, 2011