パスワードを忘れた? アカウント作成
346564 journal

phasonの日記: CMOSを利用し電気的に読み取るDNAシーケンサ

日記 by phason

"An integrated semiconductor device enabling non-optical genome sequencing"
J.M. Rothberg et al., Nature, 475, 348-352 (2011).

DNAシーケンサ(塩基配列を自動的に読み取る装置)の発明は生命科学に革命をもたらし,様々な生物の塩基配列が続々と解明されるようになった.この,現在最も広く世界で使われているDNAシーケンサ(第一世代シーケンサ)の原理は以下のようなものである.
元々の塩基(AGCT)だけでなく,それぞれを異なる蛍光分子で修飾した塩基(ddA,ddG,ddC,ddT,これらがAGCTそれぞれの代わりに取り込まれると,そこでDNAの伸長が止まる)も原料として含むような溶液中でDNAを複製すると本来の塩基の代わりに一定の確率でこれら蛍光分子で修飾された塩基がランダムに取り込まれ,末端が蛍光分子付の塩基で置換された多数のDNA断片が得られる.例えば本来の配列がAAGCTだったとすると,得られる配列としてddA,AddA,AAddG,AAGddC,AAGCddTの5種となる(ただし,この配列であることは読み取る前なので当然ユーザーにはわからない).
これを電気泳動で分けると,塩基の長さごとに分離することが出来る.今の場合,短い方から5種類の断片があることがわかる.得られた断片に対し短い方から蛍光を読んでいくと,ddA,ddA,ddG,ddC,ddTという蛍光が得られる.ここから,元々の塩基配列がAAGCTというものであった,とわかるわけだ.一度に読み出せる鎖長は数十から数百塩基だが,それをものすごく並列化して膨大な量の断片のデータを得て,それを計算機でうまいことつなぎ合わせることで元の配列を決定する.これを使いヒトゲノムの解読が終わったのが10年ほど前であり,世界各国の装置を動員して10年ほどの時間がかかった.

分子生物学の分野において,DNAの読み出し速度は力である.そのためシーケンサの読み取り速度を上げようと研究が猛烈な勢いで進んでおり,最近広まり始めた第二世代型(次世代型)シーケンサでは,第一世代の100-1000倍という猛烈な読み出し速度が実現されている(ただし,一度に読める塩基長はやや短い).この次世代型シーケンサでは,まず基板(と言うか,正しくはビーズか.で,そのビーズを固定)に読み出したいDNA断片を固定しDNAポリメラーゼをくっつける,そこに原料となる塩基を順番に流すと,ちょうど次に使われる塩基が流れてきた際に反応が起こりDNAが1塩基分複製される.この時に副生成物として出てくる化学種を光などを用いて検出することで,配列が1塩基決定されるわけだ.後はこれを繰り返し,「DNAを複製するのに必要だった塩基」を1分子ずつ順番に特定していくことで配列を決定する.ただし一度に読める鎖長が短いので,多量の断片を並列に処理する必要がある.
さらに現在では第三世代のシーケンサ(と呼ばれたり自称したりする)がPacBio社から発売されている.これは1分子シーケンサとも呼ばれているもので,基板にDNA1分子とDNAポリメラーゼを固定,そこに「DNAの合成に使われると特定の蛍光物質を放出するよう修飾した塩基」を原料として放り込む.基板に固定したDNA近傍をずっと観測していると,DNAが複製され塩基が1つ伸びるごとに対応した蛍光分子が1分子放出され,照射しているレーザーによって光る.これをモニタしておけば,1塩基伸びるごとにどの塩基が使われたかがわかる=配列が順次決定できるわけだ.さらに原理的にも非常に長いDNAをそのまま読み出せる可能性がある(現状でも1500塩基以上と結構長いものが読み出せる).1人の人間の全塩基配列を読み出すのに1時間かからない,などとも言われている(PacBio社は,2-3年以内に20分以内での読み出しを目論んでいるとか).世界で力を合わせて10年かかった頃からすると,驚くべき進歩である.
(ただし,読み出し前には相応の前処理の時間がかかる)

さて,このように長足の進歩を遂げるDNAシーケンサであるが,読み出し手法は基本的に光学的な手段にほぼ限定されていた.今回の論文で報告されているのは,この読み出しに対しCMOSを用い,電気的に読み出した,というものである.
ご存じのように,CMOSを用いた半導体デバイスは非常に微細化・高速化が進んでいるわけで,これをシーケンサに使って直接電気的なシグナルとしてDNA配列を読めるようになれば,大幅な並列化や高速化が出来る可能性がある.今回用いているのは,CMOSの上に酸化物の薄い層をのせ,その上にDNAのテンプレートを固定したビーズをのせたものである.原理としては上述の第二世代シーケンサとほぼ同じで,固定されたビーズの上にDNA複製の際の原料を順番に流す.適切な原料が流れてくると,DNAポリメラーゼによって原料が消費されDNAが1塩基分複製される.と同時に,この時の反応によってH+が放出される.このプロトンの発生により周囲のポテンシャルが変わるが,この変化が薄い絶縁層を通してCMOSのフローティングゲートの電位を変え,電流の変化として読み出すことが可能になるわけだ.従って,CMOSの電流をモニタしながら,A,G,C,T(の原料)を順次流し,電流が大きくなったところを記録,これを繰り返すことで配列を順番に読み出すことが可能となる.電流として読み出す以外は第二世代シーケンサと同じであるが,何せ通常のCMOSデバイスと同じプロセスで作成されており,並列度が非常に高い.また読み出しも光学系を準備する必要が無くお手軽になる.
そんなわけで,著者らはデモンストレーションとして1チップ(100万から1000万のCMOSユニット)で細菌の遺伝子を読んだり,1000チップ(10億のCMOSセンサーユニット)を使って人間の遺伝子を読んで見せている.ちなみに,人間の遺伝子として使ったのはあのゴードン・ムーアのものだそうだ.

なお,世の中ではさらに次世代のシーケンサとして,1分子を連続的に電気的に読み出すシーケンサの(基礎)研究が行われている.ナノサイズの穴の両側に電極を付け,この穴に何とかしてDNAを通し,何とかして1塩基ずつスライドさせながらDNAを通して流れる電流を読む.塩基の種類により電流の流れやすさが違うために読み出しが可能となる.原理的にはどんな長さのDNAでも読むことが出来るうえ,メチル化などのDNAの修飾の情報も読み出せるため,エピジェネティックな情報まで知ることが出来ると期待されている.が,原理から想像がつく通り非常に困難なハードルがいくつもあり,実際に実現するかどうかはまだ未知である.

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell

読み込み中...