次世代シーケンサーが照らし出す廃水処理微生物生態系

次世代シーケンサーが照らし出す廃水処理微生物生態系
佐 藤 弘 泰
水環境学会誌 第 35 巻 第 9 号(2012)
pp. 308 〜 314 別刷
公益社団法人 日本水環境学会
2 段組:三校
次世代シーケンサーが照らし出す廃水処理微生物生態系*
佐 藤 弘 泰
1.はじめに
2.次世代シーケンサーで捉えた微生物の栄枯盛衰
著者の研究室では,活性汚泥中の微生物群集構造の経
時的な変化を追跡するために,数年前から次世代シーケ
ンシングの導入を試みてきた。著者らが標的としてい
るのは 16S rRNA 遺伝子の一部である V1 ∼ V3 と呼ば
れる 500 bp ほどの領域である。また, シーケンシング
は学内の情報生命科学専攻の服部正平教授の研究室に
Roche 454 シリーズによる解析を依頼している。Roche
454 シリーズは次世代シーケンサーの中では長めに解読
することができ,16S rRNA 遺伝子の解析には広く用い
ら れ て い る。 以 前 は FISH 法,PCR/DGGE 法,PCR/
T-RFLP 法, といった手法を用いていたが, 手間や解
像度,種の同定の確度がそれぞれ一長一短である。それ
に比べると,次世代シーケンサーを用いた場合は,シー
ケンスから種を同定することができるし,同じ種のシー
ケンスがたくさん得られれば,その種が優占種であると
判断することができる。種の同定と,その種の多寡につ
いての定量が,一度にできてしまうのである。それは非
常に魅力的なことである。
Roche 社の 454 シリーズは, 消耗品代だけを考えれ
ば, 1本のリード(シーケンス)を最長 700 bp 程度読
むのに1円かかる。一つの試料について数百本以上の
リードを得ることができれば,微生物群集構造の大まか
なところを把握することができる。1試料あたり 1,000
本のリードを読むとすると,消耗品代は 1,000 円となる。
10 年前には1本読むのに 1,000 円くらいかかっていたこ
とを考えると,将来的にはもっと安くなると期待できよ
う。人件費等を考えても,BOD 等の一般的な測定と同
じような感覚で次世代シーケンサーで微生物群集構造を
調べる日が来るのは,時間の問題であるとさえ思えてし
まう。
本稿では,著者の研究室での次世代シーケンサーの使
い方を紹介させていただくとともに, 自前で制作した
データ解析支援ソフトについて紹介させていただく。
次世代シーケンサーの使い方はいろいろ考えられるで
あろうが,私はビデオカメラだと思って使うことを提唱
している。下水処理場であれば時系列で,また,環境試
料であればできるだけ多点・多時点で,密に試料を採取
する。それらを一斉に調べて,どの種がどのように増減
するのか,あぶり出すのである。そういう使い方であれ
ば,読み間違いはただのノイズのように見えてくるであ
ろうし,バーコード付きプライマーの増幅特性の違いも
平準化されてしまうだろう。静止画では解像度が低くて
見るに耐えないデータでも,動画にすると見ることがで
きてしまう。そういうことは多々あるはずである。恐れ
ずに,たくさんの試料を分析するのがよいと思う。その
ような使い方である。
図1にその結果の一例を示す。実験室活性汚泥リアク
Hiroyasu Satoh
平成 元 年
5年
8年
9年
東京大学工学部卒業
同大学工学部助手
同助教授
同大学院新領域創成科学研究科准
教授
工学博士
* Microbial Population in Wastewater Treatment Processes
Being Unveiled by Next Generation Sequencers
308
ターの細菌群集構造を下水処理場から採取した汚泥で植
種して運転を始めてからから数日ごとで追跡したもので
あり,属レベルでまとめた各細菌群の検出割合(その試
料の全リード数のうち,当該微生物のリード数が占めた
割合)の増減を示している。色は濃いほど多かったと見
ていただきたい。このような色の濃淡や色合いで量を直
感的に分かりやすく示す方法は,ヒートマップと呼ばれ
る。なお,黒色のセルは欠測である。
図1から,あるものは前半多く後半はいなくなり(つ
まり前半灰色後半白色)
,またあるものはその逆に後半
にのみ出現し, またあるものは特定の時期にのみ出現
し, またあるものは増えたり減ったりを繰り返してい
る,ということがわかる。増減が本物であったかどうか
を判断するために,前後のデータでつじつまがとれてい
ることが鍵となる。だいたいの挙動はそれなりにつじつ
まが合っているように見える。そして,総じて見ると,
かなり複雑な挙動である。
このリアクターの場合は SRT10 日で運転していたの
で,一週間ごとの分析ぐらいでもだいたいの傾向はわか
ると最初は思っていたのだが,そうでもなかった。実下
水処理場の汚泥を実験室で馴致している過程だから当た
り前であるという見方もできるかもしれないが,50 日
目をすぎてもまだ落ち着いていない。案外密に分析しな
いと動態はつかみにくいという印象である。
なお, このような増減の変化を判断するにあたり,
PCR 反応のバイアスといったことももちろん影響する
のであろうが,そもそもが,分析結果はバイアスが全く
ないとしても多項分布に従う誤差に影響されることとな
る。例えば, 試料中に1% 大腸菌が混じっており, 他
はすべて大腸菌以外の微生物だとする。その試料から,
1,000 本リードを得たとすると, 期待値としては, 大腸
水環境学会誌 Journal of Japan Society on Water Environment
2 段組:三校
図 1 実験室活性汚泥リアクター A の主要な細菌群の変動(属レベルで集計)
菌のリード数はそのうちの 10 本となる。しかし,それ
はあくまで確率の問題であり,実際にやってみると,た
またま 20 本大腸菌のリードが得られることもあるかも
しれないし,もしかすると1本もないということもあり
得る。逆に,1,000 本リードを読んで大腸菌のリード数
が 10 本であったとしても, そして,DNA 抽出のバイ
アスや PCR 反応のバイアスが全くないとしても,大腸
菌が 1% であるという保証はない。大腸菌が 0.5%, あ
るいは 2.0% だとしてもそうした結果が得られるかもし
れない。そうすると,測定値にはある種の信頼区間があ
ることが予想できる。実際,この場合には多項分布また
は二項分布に従う信頼区間を算出することができる。
そのような原理を考慮して, 図2に示すデータには
信頼区間を付した。この方が数値をしっかり押さえや
すく,増減について客観的にに判断することができる。
ヒートマップは大まかに傾向を読み取るのに便利だが,
Vol. 35(A) No. 9(2012)
多項分布付きの提示の仕方は正確性において勝る。な
お,図2に示したのは,図1とは別の実験室リアクター
中の細菌群集構造を8ヶ月分分析し,そこに出現したあ
る OTU(似たものどうしを仮の種としてまとめたもの)
の挙動である。実験室の活性汚泥リアクターの場合,同
一条件といっても室温は少しずつかわるし掃除の仕方も
人によってやり方が違う。時々えさがなくなっているこ
ともあるし,と,十全ではない運転ではあったと思うの
だが,
そうはいってもそこそこ安定して運転されていた。
そのようなリアクターでも,このリアクターのこの微生
物(
属)は,いつまでも増えたり減ったりし
ていた。また,30 日目から 50 日目くらいにこの種は大
繁栄していたのだが,その前後の急増と急落には驚かさ
れる。
「ホント?」と問われると,困ってしまうのであ
るが,T-RFLP 法で対応するピークが 50 日目頃に同じ
ように減少することを確認した 1)。
309
2 段組:三校
図2 実験室活性汚泥リアクターΒにおけるある Thiothrix 属
細菌の挙動
図3 実下水処理場の試料の解析結果。両処理場とも夏から
秋にかけて消失した細菌が見られた。
実下水処理場(都市下水)の活性汚泥についても月一
くらいで試料を採取させていただき分析してみた。予
想されていた こと だが季節変動するものが見つかった
(図 3 )
。しかし,一方,実処理場については課題も見つ
かった。検出される微生物の種類も多く,その分それぞ
れの種の構成割合も小さくなり,よりたくさんのリード
を読まなければ変動を把握しにくいのである。例えば実
験室リアクターでは 0.5% 以上の構成比のものを積算す
ると6割位を占めるが,実下水処理場の場合は3割にも
満たない。つまり,優占種がそれだけ少ないということ
である。構成比 0.1% の微生物を,検出しようとすると
最低 1,000 リード読まなければいけないし,ある程度で
も定量しようとするとせめて 5,000 リードくらい読みた
いところである。実下水処理場への適用にはもう一桁二
桁コストが下がるのを待つ必要がありそうである。10
年で3桁コストが下がったことを考えれば,その日はそ
れほど遠くない気もするが。
3.16SrRNA遺伝子の解析の流れ:著者の実験室の例
さて,ここでは次世代シーケンサーを使った解析の方
法を紹介させていただきたい。ただし,先にも述べたよ
うに, シーケンシングは学内の他の研究室に依頼して
やっていただいている。自前で行っているのはその他の
作業,すなわち,試料の収集,プライマーの準備,PCR
反応によるシーケンシング試料の準備,および,データ
解析である。
3. 1 試料の収集
試料の収集は, 研究者ごとに色々な流儀があろうと
思うが, 当研究室では昨年の夏頃から活性汚泥混合液
0.5 mL とエタノール 0.5 mL を混合し超音波破砕(試料
がチューブから飛び出さない範囲でできるだけ強い強度
で 15 秒ほど処理)し,-20℃または -80℃で保管するよ
うにしている。超音波破砕するのは後述するように著者
の研究室では超音波破砕・希釈法により PCR 反応をし
ているからである。そうでなければ超音波破砕は必要な
い。
この方法で試料が絶対に安定で,妙なバイアスを生ま
ないという保証はないが,しかし,エタノール濃度がか
なり高いので微生物の活動は抑制されるのは間違いな
310
い。研究室の学生に確認してもらっているが, 1年間
保管するうちに何回か試料を出し入れしても,PCR 産
物の組成に目立った変化はないようである。地震で数
日間冷凍保存ができなくなってしまうような場合も,エ
タノールが添加してあれば保険になる。また,抽出・精
製した DNA を保存するという方法ももちろんあり得る
が,抽出・精製の作業が如何に面倒な作業であるかは実
際に実験に携わった方はご存知のはずである。
3. 2 プライマーの準備
試料を収集しつつ,PCR 反応に用いるプライマーを
準備する。
次世代シーケンサーを用いる場合,
一度にセッ
トできる試料は非常に限られた数となってしまう。より
たくさんの試料を一度に分析するために,PCR 反応を
行うプライマーにバーコードと呼ばれる識別用の配列を
付加し,分析に供する方法が考案された 2)。バーコード
付きのプライマーで PCR 反応を行った場合,
プライマー
の上流にバーコード配列も付加された PCR 産物が得ら
れることとなる。バーコード配列やプライマー配列まで
含めて配列を読むことができれば,バーコード部分の配
列に基づいて,その配列がどの試料に由来するのか知る
ことができるという訳である。
Roche 454 シリーズは 10 塩基からなる 14 種類のバー
コ ー ド 配 列 を 推 奨 し て い る が 3),Ribosomal Database
Project 4)のホームページには6塩基(20 種類)
,8塩基
(72 種類)の塩基配列が紹介されている。また,
バーコー
ド配列はどちらか一方のプライマーのみに付加するのが
通常である。
原理的には両方に付加してもよく,
両側別々
のバーコード配列を使うと,一度に分析できる試料の数
を飛躍的に増やすことができるのであるが, 後述する
QIIME が両側別々のバーコードに対応していない。自
分でなんとかできる人以外は片側バーコード,または,
両側に同じバーコードをつけるのが無難であろう。
また,フォワードプライマー,リバースプライマーの
双方にアダプター配列と呼ばれるものを付加しておく
と,シーケンシングの操作を簡略化することができるだ
けでなく,解読の向きを限定することができる。アダプ
ターは2種類あり,必要に応じてどちらから読むかを指
定することができるのである(図 3 )
。
上記バーコードやアダプターについての注意のほか,
16S rRNA 遺伝子のどの領域を対象とするかも考えどこ
ろである。こうした研究ではユニバーサルプライマーと
呼ばれ,対象とする生物のほとんどすべての種をカバー
するようなプライマーを用いるのであるが,例外的にカ
バーされない生物が必ず存在する。RDP では,V4 とよ
ばれる約 200 bp の長さの領域を対象とする場合,95%
程度の種をカバーできるとしている。しかし,本当にす
べての微生物の挙動を捉えなければいけないのかどう
か, 考えてみてもよいであろう。所詮ユニバーサルプ
ライマーはどれも完璧なものではないので, その他の
面での使い勝手と相談しながら選定すればよい。Roche
454 シリーズでは徐々に解読可能な長さが長くなって
きており, 現在では 700 bp も可能である。長く読めれ
ば読めるほど, 分類を細かく行うことができる。そこ
で,私の研究室では V1 ∼ V3 の,500 bp 程度にわたる
領域を対象としている。私の研究室では T-RFLP をこ
の領域で行っているので,高速シーケンシングの結果と
水環境学会誌 Journal of Japan Society on Water Environment
2 段組:三校
T-RFLP の結果を比べることもできる。
プライマーの合成は業者に行ってもらっているが,
バーコードの数だけプライマーを発注しなければならな
い。著者らの使っているプライマーは,27 f というフォ
ワードプライマーに8塩基 72 種類のバーコードと 44 塩
基のアダプター(アダプター A)を付加したもの,およ
び,519 r というリバースプライマーに,44 塩基のアダ
プター(アダプター B)を付加したものである(図 4 )
。
結局,72+1=73 種類のプライマーを発注せねばなら
ない。プレート単位で発注すれば,それほど手間ではな
い。精製も通常の方法で十分である。
プライマーが納品されたら,まずは 100 μM・L-1 とな
るよう滅菌した超純水で溶解し,それを 10 倍希釈して
10 μM・L-1 とする。 さらに, 8連のチューブに 20 ∼
40 μL 程度ずつのフォワードプライマーとリバースプラ
イマーを混合し,分注して凍結保管している。通常のプ
ライマーの管理のしかたと基本的には同じだが,非常に
多くのものを効率的に管理するためにそれなりの工夫が
必要である。
実際に試料を分析する前に,ポジティブコントロール
とネガティブコントロールの試料を,20 サイクル,30
サイクルの2段階程度のサイクル数で PCR 反応を行い,
ネガコンがでないか,目的産物はできるか,不要な産物
(とくにプライマーダイマー)がどのくらいできるのか,
確認しておく。 プライマーダイマーが少しぐらいでき
るからといって使い物にならないということはなさそう
な印象を持っている。産物そのものは案外ちゃんとでき
ている。産物の少ないプライマーやプライマーダイマー
のできやすいプライマーは存在するので,そうしたプラ
イマーは使用しないようにしている。
また,プライマーごとにやや増幅効率にバイアスがあ
ることを指摘する研究者もいる 5)。慎重に影響を検討す
る必要があるのはもちろんではあるが,同じ試料を複数
のバーコードで分析して明らかな違いが認められなけれ
ば採用するという考え方もあるし,先に示したように経
時的に採取された試料であれば,前後の試料の結果と比
図 4 当研究室で使用しているプライマー
Vol. 35(A) No. 9(2012)
べてつじつまが合えば採用すればよかろう。また,有為
なバイアスが存在するかどうかは,多項分布に従うこと
を考慮し判断する。なお,95% 信頼区間から外れてい
るとしても,20 種に一つは信頼区間から外れて当たり
前なのだから,そして,何十種類も微生物が検出される
のだから,本当にあるプライマーにバイアスがあるかど
うかを確認するのは簡単ではない。
3. 3 PCR 反応とその産物の精製・混合
そうこうするうちに試料がたまってくる。活性汚泥プ
ロセスの運転成績を見ながら,どの時期の試料を分析し
ようかと考える。
これはと思う試料を取り出し,
どのバー
コードのプライマーで PCR を行うか,計画を立て,い
よいよ PCR 反応である。変化を正確に捉えようとする
と,その時点の前後一週間ぐらいについてはできれば毎
日でも試料が欲しい。
試料を冷凍庫から出すが,エタノールを混ぜてあるの
で,仮に -80℃で保管してあったとしてもすぐに融解し
て作業に取りかかることができる。市販のキットを用い
て DNA を抽出・精製して PCR 反応のテンプレートを
作成してもよい。また,著者らは試料を適宜希釈するだ
けで PCR 反応のテンプレートとしている(超音波破砕・
希釈法 6))
。たくさんの試料を分析するにあたり, 操作
の煩雑な方法はどうしてもヒューマンエラーの原因とな
る。超音波破砕・希釈法は,本当に,冷凍庫から出した
試料を希釈するだけなので,よほど油断していれば別だ
が,まず間違わない。興味の対象の微生物が,もしこの
方法で分析できるのなら,導入を考える価値があろう。
いよいよ PCR 反応を行うが, そのときには, 1本1
本の試料にそれぞれ計画どおりのプライマーを入れなけ
ればいけない。やはりヒューマンエラーをさけるための
工夫が大切である。試料を8個単位で扱い,8連のマル
チチャンネルピペット等で扱うと,だいぶ楽になる。試
料の取り扱いもバーコード付きプライマーの取り扱いも
「8」がキーナンバーであると心得ておくと,実験計画
を立てやすい。
PCR 反 応 そ の も の は, 通 常 ど お り に 行 っ て い る。
barcode 等を付加したからといって,アニーリング温度
等を最適化したことはない。
PCR 産物には, プライマーダイマーが含まれている
ことがある(図 5 )
。その場合は, ダイマーを除去す
ることができる精製キット(Roche 社 High Pure PCR
Product Purification Kit 等)を用いたり,あるいは,ゲ
ル電気泳動で分離し目的のバンドだけを切り出し,ダイ
マーを除去する。各サンプルについて行うのは面倒だし
高くつくので,いくつかの試料を混合してから行ってい
る。
さらに, 一度の分析に供する試料を一つのチューブ
に混合すれば, 準備完了である。この時点で DNA の
量として 0.5 μg 程度あれば十分である。精製するたび
に DNA の量は半分ぐらいになってしまうので,それを
考慮しながら以上の作業を行う。各試料の PCR 反応を
20 μL スケールで行い,
産物の濃度が 10 ng・μL-1 となっ
たとすると, 各試料について 0.2 ng の産物があること
になる。72 個の試料をひとまとめにして分析にかける
とすると,精製・混合作業の出発点では 3.6 μg の DNA
があることになる。精製で少々のロスがあっても,精製
311
2 段組:三校
図5 バーコード・アダプター付きプライマーでの PCR 産物
の電気泳動図
DNA0.5 μg を得るには十分である。
一連の作業において,PCR 産物やその精製物の濃度・
純度を管理することが大切である。純度・濃度を確認す
るには,キャピラリーチップ電気泳動法(Agilent 社の
2100 Bioanalyzer 等)が便利ではあるがランニングコス
トが馬鹿にならない。純度についてはアガロースゲル電
気泳動法で確認するのでも十分である。一方,濃度の確
認には,著者の研究室では PicoGreen 法を使っている。
マイクロプレートを使って蛍光分析すると,簡便かつ安
価に定量でき,また,PCR 反応産物を精製しなくても定
量することができるので重宝しているが,プライマーダ
イマーが定量に引っかかってしまうという欠点がある。
また,試料を混合するときに,それぞれの試料からの
目的 PCR 産物の量が同じくらいになるように混合する。
しかし,前述のように PCR 産物にダイマーが含まれて
いるときには,産物の量を正確に把握することは困難で
ある。おおまかに同じぐらいの量なのであれば,細かい
ことは気にせずに混合するのがよいであろう。
以上の作業を行った後は,シーケンシングに向けての
作業となる。しかし,現時点では自分で以後の操作を行
う場合は少なく,むしろ,外注するのが一般的であろう。
3. 4 シーケンスデータの解析
データが帰ってくる。指定された FTP サーバーから
ダウンロードし,開いてみる。ドキドキする瞬間である
が,開いてみるだけで内容がわかる人間はおそらく地球
上に一人もいないであろう。
Roche 454 シリーズの機器から返される分析結果は
sff と呼ばれる形式だが,そこから,シーケンスデータと
信頼度(quality)のデータを抽出したものも結果とし
て返される。シーケンスデータと信頼度データはいずれ
も FASTA 形式で記述されており, テキストエディタ
で開いて内容をみることができる。信頼度データは,解
読された各塩基について,信頼性を0∼ 40 までの数値
であらわしたものである。読んでわかる訳がない。
大 量 の 16S rRNA 遺 伝 子 塩 基 配 列 デ ー タ を 解 析 す
るための, 非常に強力なツールとして,University of
Colorado at Boulder の Knight Lab において開発され
た QIIME が便利である 7)。しかし, 同ソフトは強力と
いっても,unix ベースでいちいちコマンドを入力して
312
実行しなければならない。大量のデータを定型処理す
るには非常にすばらしいソフトウェアであるが, 小回
りのきいたことをするのには, なかなか難しい。そこ
で,著者らは FileMaker Pro(ファイルメーカー社)を
用いて,QIIME ではカバーしきれない作業を行うソフ
ト ウ ェ ア,OTUMAMi(Operational Taxonomic Unit
Management And Mining) を 開 発 し た。OTUMAMi
は ま た,QIIME で 使 用 す る コ マ ン ド を 自 動 的 に 生
成 し て く れ る。OTUMAMi は Mac OS X 上 で 動 き,
MacQIIME(QIIME の Mac OS X 版 8)) と FileMaker
Pro. V10.0(FileMaker 社)以上を必要とする。
さて,ここから先の作業は次のとおりである。
⑴ 第一段階:リードの整理
1- 1 )信頼度データをもとに,信頼性の低いデータを
捨てる。
1- 2 )プライマーダイマーに由来したり,あるいは何ら
かの理由で十分な長さで読めなかったリードを除去する。
1- 3 )バーコード配列に基づいて各リードのもとと
なった試料を特定し,かつ,リードに番号をつける。
1- 4 )各リードの下流側のプライマー以下の配列を除
去する。除去しなくてもよい場合もあるが,キー配列や
アダプター配列が残っている場合は除去する必要がある。
1-5 )リバースプライマー側から読んだリードが含ま
れる場合は,
reverse complementary(逆相補)になおす。
1-6 )たくさんの試料を分析する場合,一度の解析で,
例えば A 君の研究に関連する試料と B 君の研究に関連
する試料を読む場合もある。また,C 君の試料は複数回
の分析にまたがっているという場合もある。目的に応じ
て,それらを整理し,必要なリードだけを取り出して,
A 君,B 君,C 君に返す。
1-1 ∼ 1-3 は,QIIME で 実 行 す る。 た だ し, コ マ
ン ド は OTUMAMi シ リ ー ズ の ソ フ ト の 一 つ で あ る
OTUMAMiPrep で生成するので,作業対象となるファイ
ルを指定し,解析条件を設定し,ボタンをクリックする
だけである。OTUMAMiPrep で 1-4 ∼ 1-6 の作業を行う。
⑵ 第二段階:QIIME を用いての解析
2- 1 )よくにた配列同士を集めて OTU(operational
taxonomic unit)としてまとめる。つまり, 似た者同
士を同じ分類に属するものとして, ひとまとめにする
(OTU データ)
。
2- 2 )それぞれの OTU について,代表的なリードを決
める。以下の作業は各 OTU の代表リードに対して行う。
2- 3 )代表的リードを塩基配列に基づいて分類する。
属レベルまで決定できる場合もあれば,界レベルでしか
帰属できない場合もある(taxonomy データ)
。
2- 4 ) 代 表 的 リ ー ド の 塩 基 配 列 を 相 互 に 比 べ る。
alignment とよばれる作業である。通常,alignment は
対象とするリード同士で行うが,その場合,リードの数
の二乗に比例して計算時間がかかることとなり, 多数
の塩基配列を比較するのは困難である。QIIME が通常
行う alignment は NAST と呼ばれる方法をとっており,
試料から得られたリード同士を比較するのではなく,既
知のデータから作成した template とよばれるデータと
比較することで,
多数のリードを短時間で処理している。
(aligned sequence データ)
2- 5 )樹形図を描くために必要なデータを算出する。
水環境学会誌 Journal of Japan Society on Water Environment
2 段組:三校
これも,対象とするリード数が多いと通常は非常に時間
がかかるが,QIIME では, まずは相同性を決定するた
めに鍵になる配列のみを抽出し,FastTree とよばれる
アルゴリズムによって樹形図を算出する。2-4 )
,2-5 )
で用いられているアルゴリズムは,rRNA 遺伝子のよう
に,データベースとして一定の蓄積があるからこそ可能
な便法であるといえる(tree データ)
。
QIIME で は,make_otu_through_phylogeny.py と い
うコマンドを用いると上記の作業を一気に片付けること
ができる。OTUMAMi を用いる場合は,やはり然るべ
きボタンをクリックするとそのコマンドを発してくれる。
⑶ 第三段階:更なる加工
QIIME か ら は, 主 要 な デ ー タ が OTU デ ー タ,
taxonomy データ,tree データなど,複数のファイルに
分かれて出力されてくる。それらを有機的に組み合わせ
ると,ようやく全体像をつかむことができる。しかし,
その作業は容易ではない。その作業を支援するのが著
者らの開発した OTUMAMi の心臓部である。例えば主
要な OTU だけの挙動を確認したいというとき,QIIME
では必要なものだけ取り出さなければいけないが,なか
なか面倒であるが,OTUMAMi では, ごく普通に検索
するだけでよい。
また,OTUMAMi の大きな特徴の一つは,柔軟にヒー
トマップを作ることができるところである。各 OTU の
ヒートマップを図3のように2段にして示すこともでき
るし,必要であれば地図と組み合わせたヒートマップを
作ることもできる。
また,OTUMAMi では樹形図データを読み込んで,
その順番どおりに OTU を並べ替えることができ,その
機能を利用すれば樹形図とヒートマップを組み合わせた
。既知の近縁種との類
図を作成することができる(図 6)
縁関係と出現傾向をあわせて把握するのに便利である。
もう一つの大きな機能は,T-RFLP のような計算を
行う こと である。得られたリードから制限酵素の認識
部位を探し出し,T-RF 断片の大きさを計算する。さら
に,各試料について,どの大きさの断片がいくつあった
かを算出し,T-RFLP パターンを算出予測する。実際
の T-RFLP パターンとやや異なるところもあるが, お
おむね似たような結果が得られる。次世代シーケンサー
図6 樹形図とヒートマップの組み合わせの例。2000470820
9)
は,Garcia Martin et al. に よ り 報 告 さ れ た
Accumulibacter phosphatis
Vol. 35(A) No. 9(2012)
による解析で見られた増減が本物かどうかを,T-RFLP
の結果と比較して調べることができる。
⑷ 重要な OTU のデータベース化
環境中の微生物には名前がまだついていないものが
多い。DDBJ などで類似のシーケンスを検索すると,類
似のものが見つかる場合もあるが,それでも
“unknown
bacteria”が一番近縁であるということがしばしばであ
る。名無しの権兵衛についての知見をどのように蓄積す
るか。案外それが一番重要な課題ではないかと思ったり
する。
も ち ろ ん い ち い ち DDBJ に 塩 基 配 列 を 登 録 し て,
accession number を得て管理するのも一つの方策では
あるが,accession number は名前としてはいかにも無
機質で覚えにくい。登録の必要がないという場合もあろ
う。また,DDBJ にいつどこにどれだけ見つかったとい
う情報を入力するのはそう簡単ではない。
OTUMAMi シ リ ー ズ で は, 名 無 し の 権 兵 衛 に つ
い て も そ れ な り に 扱 う 手 法 を 提 案 し て い る。 最 新
の OTUMAMi バ ー ジ ョ ン 2 で は, 各 分 析 で 得 ら れ
た 重 要 な OTU の デ ー タ を, 出 現 状 況 ま で 含 め て
集 積 し, 保 管 管 理 す る た め の デ ー タ ベ ー ス と し て,
OTUMAMiLocalReferences を追加した。名無しの権兵
衛でも,
「この権兵衛はあの時のあの権兵衛の兄弟みた
いだ」
ということぐらいは言えるようになる。
ニックネー
ムのようなものもつけて管理することができる。DDBJ
等に登録されている配列と比較して系統樹を描くことも
できる。少なくとも,個人レベルでは重要な OTU を管
理するのに最低限必要な機能は提供できるであろう。具
体的な使用方法は, 著者のサイト 10) を訪ねていただき
たい。今のところ使い勝手が今ひとつかもしれないが,
徐々に改良していく予定である。
4.終わりに
次世代シーケンサーが照らし出す世界は,今まで誰も
見ることのできなかった世界である。しかも,変動を,
高精度にとらえることができる。水処理に有益な情報を
もたらすであろうことは間違いない。どの微生物が多い
ときに処理がよくなり,あるいは逆にトラブルが発生す
るのか,これまでよりも精確に(間違いなく)記述でき
る。データベース化もしやすい。知識を扱いやすい形で
確実に集積できるということが,何よりも大きなメリッ
トである。微生物製剤等の効能も,客観的に把握できる
ようになるであろう。QIIME や OTUMAMi でできる
ことは次世代シーケンサーで可能なことのごく一部でし
かないが,それだけでも大きな成果が得られるはずであ
る。また,入門には手頃である。機会があれば,是非,
挑戦していただきたい。
謝 辞
本研究は文部科学省 GCOE「ゲノム情報ビッグバン
から読み解く生命圏」
(代表 森下真一)および学術振興
会科学研究費基盤研究Α(課題番号 2246069, 代表 味
埜俊)のもとで実施している。また,試料を提供してく
ださった実処理場の方々,私の研究室の学生諸氏,シー
ケンシングをしてくださった服部正平教授および同研究
室の方々に謝意を表す。
313
2 段組:三校
参 考 文 献
1)
Satoh, H., Oshima, K., Suda, W., Ranasinghe, P., Li, N.,
Gunawardana, E. G. W., Hattori, M. and Mino, T.(in press)
Bacterial Population Dynamics in a Laboratory Activated
Sludge Reactor Monitored by Pyrosequencing of 16S rRNA.
.
2)
Parameswaran, P., Jalili, R., Tao, L., Shokralla, S., Gharizadeh,
B., Ronaghi, M. and Fire, A. Z.(2007)A pyrosequencingtailored nucleotide barcode design unveils opportunities for
large-scale sample multiplexing.
, 35(19)
,
e130.
3)
454 Life Sciences Corp.(2010)GS Junior System Guidelines
for Amplicon Experimental Design.
4)
Ribosomal Database Project(2012)
, http://rdp.cme.msu.edu/
(2012 年 7 月時点)
.
5)
Barr, J. J., Slater, F. R., Fukushima, T. and Bond, P. L.(2010)
Evidence for bacteriophage activity causing community and
performance changes in a phosphorus-removal activated
sludge,
, 74(3)
, 631-642.
6)
佐藤弘泰,小貫元治,味埜俊(2008)活性汚泥中微生物群集構
造解析のための超音波破砕と希釈による新規 DNA 抽出手法の開
314
発,環境工学研究論文集,45,225-232.
7)
Caporaso, J. G., Kuczynski, J., Stombaugh, J., Bittinger, K.,
Bushman, F. D., Costello, E. K., Fierer, N., Pena, A. G., Goodrich,
J. K., Gordon, J. I., Huttley, G. A., Kelley, S. T., Knights, D.,
Koenig, J. E., Ley, R. E., Lozupone, C. A., McDonald, D., Muegge,
B. D., Pirrung, M., Reeder, J., Sevinsky, J. R., Tumbaugh, P. J.,
Walters, W. A., Widmann, J., Yatsunenko, T., Zaneveld, J. and
Knight, R.(2010)QIIME allows analysis of high-throughput
community sequencing data,
, 7(5), 335-336.
8)
Werner, J. J.(2012)http://www.wernerlab.org/software/
macqiime(2012.7 時点)
.
9)
Garcia Martin, H., Ivanova, N., Kunin, V., Warnecke, F.,
Barry, K. W., McHardy, A. C., Yeates, C., He, S., Salamov, A.
A., Szeto, E., Dalin, E., Putnam, N. H., Shapiro, H. J., Pangilinan,
J. L., Rigoutsos, I., Kyrpides, N. C., Blackall, L. L., McMahon,
K. D. and Hugenholtz, P.( 2006)Metagenomic analysis of
two enhanced biological phosphorus removal(EBPR)sludge
communities,
, 24(10)
, 1263-1269.
10)
東京大学大学院新領域創成科学研究科 社会文化環境学専
攻 味埜 ・ 佐藤研究室,http://www.mwm.k.u-tokyo.ac.jp/Plone
(2012 年 7 月時点)
.
水環境学会誌 Journal of Japan Society on Water Environment