『分子生物学』

2014/10/6
第一薬科大学 3年生
祝日の振替講義
講義しません。
10月11日(土)、10月18日(土)、11月1日(土)
『分子生物学』
後期
第3回
講義する。
11月21日(金)
分子生物学教室 担当:荒牧弘範
(H26.10.6)
③
`
`
`
`
`
非コード領域を埋める反復配列 (p91)
DNAを制限酵素で切断するとDNAが断片化する。
その混合物を密度勾配遠心にかけ分離すると、大部分
のDNA断片は一つの主ピークに集まる。
それより密度が少しずれて、小さなピークを形成するの
がサテライトDNAである。
サテライトDNAは縦列反復配列と呼ばれるものの一つ
である。
これに対して、一定の長さの配列をした転移性DNA因
子(トランスポゾン)がゲノム上に分散して存在している。
それらを分散型反復配列と呼んでいる。
a.縦列反復配列
`
ある位置の反復配列の反復回数が個人によって異なっ
ていることから、マイクロサテライトDNAは個人の識別に
利用されたりする。
a.縦列反復配列(p91)
`
`
`
サテライトDNAはセントロメアに多く、動原体の形成や複
製の制御に関係すると見られている。
ミニサテライトDNAとしては、テロメアのTTAGGG繰返し
配列がある。
(CA)/((TG)のような2塩基反復配列やAやTの1 塩基反
復配列に代表されるマイクロサテライトDNAは、ゲノム
上に広く分布している。
a.縦列反復配列
`
このような反復配列の部位では、スリップ複製により反
復配列が伸長したり欠失したりしやすい。
1
2014/10/6
b.分散型反復配列(p91)
`
`
真核生物では、DNA上の
反復配列から転写された
RNAが逆転写酵素により
二本鎖DNAに変換される
。
ゲノム中に再び取り込ま
れることにより生じたレト
ロトランスポゾンが大半で
ある(図5・6a)。
(1)Alu配列とLINE-1 (p91)
`
`
`
レトロトランスポゾンの中で重要なのは、Alu配列とLINE1である。
Alu配列の中には現在も活発に転写されているものがあ
る。
LINE-1のうちの100個が今も転移能をもっており、遺伝子
を破壊して疾患を引き起したことが報告されている。
b.分散型反復配列
`
`
(1)Alu配列
`
`
`
`
(1)LINE-1
`
`
LINE-1は、長い分散型反復配列(LINE; long interspersed
nuclear element)の一種である。RNAポリメラーゼⅡが
配列の末端にあるプロモーターに結合し、転写を開始す
る。
LINE-1がコードする逆転写酵素が、Alu配列の転移や後
述する偽遺伝子の生成など、細胞内でおきる逆転写反
応に関与している。
興味深いことに、分散型反復配列である転移性DNA因
子の配列の総和は、ゲノム全体の45%にもなることがわ
かった。
それらの大部分は、大昔は転移能を持っていたが現在
では活性をなくし、化石のような存在となっている。
Alu配列は、短い分散型反復配列(SINE; short
interspersed nuclear element)の一種である。
約300塩基の長さで内部に制限酵素Aluの切断部位があ
ることから名付けられた。
Alu配列内部のプロモーターにRNAポリメラーゼⅢが結
合し、転写を開始する。
Alu配列は、シグナル認識粒子中の7SL RNAに由来して
いるが、逆転写酵素はコードしていない。
(2)DNA型トランスポゾン(p92)
`
`
DNA型トランスポゾンは
自身を切り出すか複製し
て標的DNAに転移する
が、ヒトでは現在は活性を
失ってしまっている。
しかし、組換え酵素やセ
ントロメア結合タンパク質
をコードする遺伝子は今
も機能しており、それらは
DNA型トランスポゾンに
由来している(図5・6b)。
2
2014/10/6
ポイント
`
`
`
遺伝子の本体はDNAであり、生殖細胞(配偶子)の全
DNA(核DNAとオルガネラDNA)がゲノムである。
ゲノムには、タンパク質のアミノ酸配列の情報をコードす
る遺伝子の他、機能性 RNAの遺伝子が存在している。
ゲノムの非コード領域には、縦列反復配列や分散型反
復配列などの要素が見つかり、それらの意味が注目さ
れている。
①タンパク質のモジュール構造(p93)
`
`
C.遺伝子の進化
(p93)
`
`
②
`
`
エキソンシャッフリング(p93)
エキソンシャッフリングでエキソンが付加すると、生じた
遺伝子から転写・翻訳されるタンパク質に、タンパク質同
士が相互作用する場が追加される。
このような相互作用が増えれば新たな機能や調節機構
が付け加わるので、転写・翻訳される遺伝子数の少なさ
を補えることになる。
個々のエキソンに由来するアミノ酸配列は、高次構造を
組立てる素材の単位モジュールとして働いているという
考え方がある。
それによると、タンパク質はこれら素材単位の組み合わ
せで出来上がっていることになる。
遺伝子の進化も、エキソンを組換えたり追加したりして素
材の単位を付加するほうが、点突然変異でコドンを変化
させてアミノ酸残基の置換を引き起すよりもずっと効果
的である。
このようにエキソンが組み換わる現象を、エキソンシャッ
フリングと呼ぶ。
a.レトロ転移によるエキソンシャッフリング
(p93)
`
レトロ転移とは、細胞内の
mRNAが逆転写されて相
補的なDNAとなり、染色
体の新たな位置に組込ま
れることである。
`
長い分散型反復配列であ
るLINE-1の配列内に存在
するポリA付加シグナル
の機能は弱い。
3
2014/10/6
ヒトβ-グロビン遺伝子の構成
a.レトロ転移によるエキソンシャッフリング
(p93)
`
`
このため、ある遺伝子の
イントロン内にはいり込ん
だLINE-1の転写が起きる
時、転写が近傍のエキソ
ン配列まで進むことがあ
る。
このような場合、本来の
LINE-1の配列にエキソン
部分が付加した融合
mRNAが生成する。
転写領域は3つのエクソン(赤)と2つのイントロンで構成される。
a.レトロ転移によるエキソンシャッフリング
(p93)
`
このmRNAが逆転写され
た二本鎖DNAが、別の遺
伝子や同じ遺伝子のイン
トロンに挿入されると、エ
キソンが追加されることに
なる。
b.不等交叉によるエキソンシャッフリング
(p94)
`
`
`
③
`
`
`
遺伝子重複 (p94)
エキソンシャッフリングは、
遺伝子内の不等交叉が原
因で生じる場合がある。
遺伝子の複製時、類似配
列が存在するとその部分で
交叉が起きる。
複数の類似配列があると
不等交叉の原因となり、エ
キソンが追加された長い染
色体と、エキソンを失った
短い染色体が生じる(図5・
8a)。
③
遺伝子重複 (p94)
遺伝子にコードされるタンパク質の構造や基本的な機能
がほとんど同じで、生理的役割が異なる遺伝子をグルー
プ分けすることが可能である。
それらを遺伝子ファミリーと呼んでいる。
薬理作用や医薬品の標的としても重要な、7回細胞膜を
横切るGタンパク質共役型の受容体も、遺伝子ファミリー
を構成している。
4
2014/10/6
③
`
遺伝子重複 (p94)
遺伝子ファミリーが存在
するのは、エキソンシャッ
フリングに加え、遺伝子
が重複して増えてきたか
らである(図5・8b)。
③
`
`
`
`
ヒトとチンパンジーのゲノムと遺伝子
`
`
`
ヒトとチンパンジーはおよそ700万年ぐらい前に分岐した
と考えられています。
700万年ぐらい前にはヒトとチンパンジーの共通の祖先
種がいて、その種が暮らしていたわけです。
それがある条件下で分かれ、ヒトとチンパンジーにそれ
ぞれ進化してきたわけです。
オーソログ
`
`
オーソログ遺伝子はヒトとチンパンジーと種が違っていて
も、塩基配列には高い相同製を持っていますので、その
遺伝子由来のタンパク質には共通の機能を持つことが
多い。
このオーソログな遺伝子を、ヒトとチンパンジーに限らず
、酵母から植物や動物などいろいろな種で見つけると、
その遺伝子Aの塩基配列やアミノ酸配列を見比較するこ
とで進化の過程を推定したり、あるいは種によっては機
能のわかってない遺伝子の働きを推定したりすることが
できます。
遺伝子重複 (p94)
重複した遺伝子はもともとの遺伝子が既に存在すること
から、変異を蓄積しやすい。
その結果、転写されなくなったり、転写されても機能する
タンパク質を生成できなくなったりして、偽遺伝子として
名残をゲノム上に残すことになる。
ヒトゲノム上には多くの偽遺伝子が存在することから、遺
伝子重複は頻繁に起きていたと推定される。
遺伝子重複は、エキソンシャッフリングとともに、タンパク
質が新たな機能を付加したり獲得したりするのに役立っ
た。
オーソログ
`
ヒトとチンパンジーの共通祖先が持っていたある遺伝子
Aに注目し、その遺伝子Aが進化の過程で、つまり700万
年の間に突然変異などで変化し、現在のヒトの遺伝子AHやチンパンジーの遺伝子A-Cになった場合、その遺伝
子A-Hと遺伝子A-Cをオーソログといいます。
パラログ
`
`
`
あるひとつのゲノムの中で、遺伝子の重複が起こり、あ
る遺伝子が複製されることがあります。
その複製によってできた類縁関係にある遺伝子のことを
パラログといいます。
これも、進化の過程で重複があった時点からの時間に
依存して、突然変異などによって塩基配列が変化します
ので、重複が起こったときは同じ配列ですが、そのうち異
なる配列になります。
しかし、よく似た配列であって、その遺伝子由来のタンパ
ク質の機能もよく似ているはずです。
5
2014/10/6
a.レトロ遺伝子(p95)
`
`
`
a.レトロ遺伝子(p95)
`
`
このような遺伝子をレトロ
遺伝子と呼び、イントロン
がない(図5・6a)。
ゲノム中に見つかるイント
ロンのない遺伝子の中に
は、このような機構で生じ
たものがあると考えられ
ている。
b.不等交叉による遺伝子重複(p96)
`
`
グロビン遺伝子のクラスターが存在するのは、遺伝子重
複が起きたことを示す良い例である。
今から8億年前のグロビン遺伝子の祖先遺伝子は単
量体グロビンをコードしていた。
LINE由来の逆転写酵素
が発現すると、細胞内に
存在する転写後の成熟
mRNAを鋳型にして二本
鎖DNAが合成される。
このDNAがゲノム中に再
び組込まれたものを、レト
ロトランスポゾンという。
組み込まれた先が、ある
遺伝子のプロモーター配
列の近傍だった場合には
、発現する遺伝子となる。
b.不等交叉による遺伝子重複(p95)
`
遺伝子の重複は染色体
の不等交叉によっても生
じる。図5・8bに示したよう
に、染色分体が不等交叉
によって組換えを起すと、
片方は遺伝子が重複し、
片方は遺伝子が欠失した
染色体が生成する。
b.不等交叉による遺伝子重複(p96)
`
`
5億年前には四量体グロビンの祖先遺伝子が生じた。
その後、5億年前にαとβグロビン遺伝子に分かれ、それぞれ
がさらに遺伝子重複によって進化してきた(図5・9)。
6
2014/10/6
b.不等交叉による遺伝子重複
`
`
`
現在ヒトのαグロビン遺伝子のクラスターでは、ζの下流に全く
等しいα遺伝子が2個並んでいる。
また、βグロビン遺伝子のクラスターでは、ほとんど同じγGと
γAが並んでいる。
へモグロビンはαタイプとβタイプのグロビンが2分子ずつ四量
体に集合したもので、酸素の運搬を行う。
ポイント
`
`
`
エキソンはタンパク質の構造を組立てるモジュールとし
て働く。
エキソンシャッフリングや遺伝子重複はレトロ転移や不
等交叉により生じる。
グロビン遺伝子の進化には遺伝子重複が寄与した。
6章
ヒトゲノム
(p95)
SBO:ヒトゲノムの構造と多様性について説明できる。
7
2014/10/6
a ゲノム(図6・1)
`
`
`
ヒトは2倍体生物であるから、ゲノム情報を2セットもって
いる。
1セットは母親から受け継いだもの(図6-1では青色で示
した各染色体)であり、もう1セットは父親から受け継いだ
もの(図6-1では灰色で示した各染色体)である.
これらは互いに相同染色体という.
A ゲノムとは何か
①ヒトゲノム
a ゲノム
`
`
`
ヒト染色体数は常染色体
が22対で44本であり、性
染色体が1対、2本で合わ
せて46本存在する.
Y染色体には男性となる
ことを決定する遺伝子が
コードされているのでY染
色体を持つものが男子と
なる.
したがって44+XYが男子
、44+XXが女子である.
b.ヒトゲノムプロジェクト(p100)
`
1985年に米国でヒトゲノ
ムの全DNA塩基配列を
決定することが提案され
た(図6・3).
(p99)
a ゲノム
`
染色体には、遺伝子と遺伝子をつなぐ領域(スペーサー
領域)や、イントロン、セントロメア、テロメアなど遺伝子を
コードしていない領域や、後述する反復配列なども存在
するがそれらすべての領域を含めてゲノムという(図6・2
)
b.ヒトゲノムプロジェクト(p100)
`
`
当時は技術的、金銭的な問題等があって計画はなかな
か進まなかったが、DNAの塩基配列決定法を開発した
ギルバートやDNAの立体構造を解明したワトソンなどの
ノーベル賞を受賞した著名な科学者たちがヒトゲノムプ
ロジェクトに積極的に参加し推進した。
のちに日中米欧を含む国際コンソーシアムが作られ、世
界中が参画する巨大プロジェクトに発展し、日本もヒトゲ
ノムプロジェクトに大きく貢献した。
8
2014/10/6
b.ヒトゲノムプロジェクト(p100)
`
`
`
この間に、大腸菌、パン酵母、線虫、ショウジョウバエな
どの、古くから生命科学研究に用いられてきたモデル生
物の全ゲノムDNA塩基配列が解読された。
これに伴い、DNAの塩基配列決定技術が飛躍的に向上
した。
特筆すべき出来事は、ヒトゲノムプロジェクトが進行する
過程で民間企業がそれまでとは異なる手法を用いてコ
ストを抑えてゲノムプロジェクトに参入してきたことである
。
b.ヒトゲノムプロジェクト
`
`
`
`
それまでは1996年に成立したバミューダ原則にしたがっ
てヒトゲノムプロジェクトで得られた成果は公表されてい
た。
バミューダ原則とは、ヒトゲノム配列は公共の財産なの
で解読したらただちに公表する、という原則である。
これに対して新規参入側はバミューダ原則を無視して、
決定した配列は公表せず、希望する製薬会社や団体に
販売すると宣言した。
このことは、ヒトゲノムの情報が特定団体に占有される
危険があることを示していた。
b.ヒトゲノムプロジェクト
`
この発表を受けて国際コ
ンソーシアムにおけるヒト
ゲノム計画はDNA配列決
定を加速し、ついに2001
年2月2日にはヒトゲノム
の概要版が発表され、
2004年10月には国際コン
ソーシアムによる最終版
が発表された(図6・3) 。
c.ゲノムサイズと遺伝子の数(p102)
`
`
`
ヒトゲノムマップ
`
ヒトの染色体は、どれも直鎖状構造をしている。
ヒト1倍体(卵や精子)に含まれるDNA塩基数をゲノムサ
イズといい、ヒトの場合約31億(3.1ギガ)塩基対になる。
パン酵母は約12メガ塩基対、結核菌は約4.4Mメガ塩基
対となる。
ヒトの約31億塩基対のゲノムには、約22,000個から
30,000個のタンパク質をコードする遺伝子が存在する。
http://www.pcost.or.jp/pg42.html
9
2014/10/6
c.ゲノムサイズと遺伝子の数(p102)
`
`
`
`
生物は、体制が複雑になるほど多くの遺伝子が必要に
なるのでゲノムサイズも大きくなる傾向にある。
たとえば、細菌の一種である大腸菌(Escherichia coli K-12
)のゲノムサイズは約4.6メガ塩基対で遺伝子数は約
4,400個、
単細胞の真核生物であるパン酵母(Saccharomyces
cerevisiae)のゲノムサイズは約12メガ塩基対で遺伝子数
は約6,300個、
昆虫の一種であるショウジョウバエ(Drosophila
melanogaster)のゲノムサイズは約120メガ塩基対で遺伝
子数は約13,600個である(図6・4) 。
d.ヒトゲノムにコードされた遺伝子の数
(p103)
`
`
`
`
d.ヒトゲノムにコードされた遺伝子の数
`
この矛盾は、1つの遺伝子からmRNAが転写される際に
選択的スプライシング(p52)と呼ばれる現象によって、数
種類のmRNAが生じ、それらを元にアミノ酸配列の異な
った数種類のタンパク質が生じることが明らかになったこ
とで理解された。
ヒトの全ゲノムDNAの塩基配列の解読が終了する以前
は、ヒトのタンパク質をコードする遺伝子数は10万前後
であろうといわれていた。
しかし、ヒトゲノムプロジェクトの結果、ヒトゲノムにコード
される遺伝子数は22,000-30,000個であるという結果が
得られた。
この数は、予想された数よりもはるかに少ないものであ
った。
ヒトの細胞にはこれよりはるかに多くのタンパク質が存
在することが分かっていた。
e.ヒトゲノムのいくつかの領域(p104)
`
ゲノムにはエクソン、イントロンからなる遺伝子部分や、
それらを制御しているプロモーター領域、遺伝子と遺伝
子をつないでいるスペーサー領域が存在することはヒト
に限らず全ての生物のゲノムで共通であるが、そのほか
にもヒトゲノムにはいくつかの特徴的な領域が存在する
ことが明らかとなった。
10
2014/10/6
(1)反復配列(p104)
`
`
ゲノムには、遺伝子をコードする領域や、その上流と下
流に存在する調節領域のほかに、他の真核生物のゲノ
ム同様にマイクロサテライトや、ミニサテライトVNTR(
Variable Number of Tandem Repeat)といった反復配列が
存在する。
反復配列は各個人で反復数が異なっている場合があり
、ヒトゲノムの多様性にも関与する。
(2)機能性RNA(p104)
`
`
`
ヒトゲノムプロジェクトによるゲノムDNA塩基配列の決定
では、遺伝子をコードする領域を同定することが目標の
1つであった。
このため、mRNAから合成したcDNAを網羅的に解析し
て遺伝子コード領域、とくにエクソン部分を同定するため
のプロジェクトが進められた。
当初は遺伝子をコードする領域を同定することを目的と
したが、解析が進むにつれて、本来遺伝子をコードして
いないはずの領域からもRNAが転写されており、これら
が遺伝子発現制御や、ある種の疾患にも関与する可能
性が出てきた。
(2)機能性RNA
`
`
`
ゲノムプロジェクトではそれらに加えて新たな機能性
RNAが大量に存在することが示された。
さらに、タンパク質をコードせずに未知の機能を持つ機
能性RNAが転写される領域は、ゲノムの非遺伝子コード
領域の約7割にも及ぶことがわかった.
この量は、上記のエクソン部分が全ゲノムの1.5%ほどし
かないことと比較して圧倒的に多いことがわかる。
(1)反復配列
`
`
`
反復配列はヒトゲノムのうち
の45%近くにおよぶ。
つまり、ヒト1倍体ゲノムの
31億塩基対のうちほぼ半分
が、タンパク質をコードして
いない反復配列で占められ
ていることになる。
さらに、スペーサー領域や
イントロンも加えると、ヒトゲ
ノムDNAにおいて遺伝子を
コードしている領域(エクソ
ン部分)は全体の1.5%ほど
しかないと考えられている(
図6・5)。
(2)機能性RNA
`
タンパク質をコードしないが細胞内で何らかの機能を持
つRNA(機能性RNA non-coding RNA;ncRNA,p88)とし
ては、以前から
`
`
`
`
tRNA(mRNAのトリプレットに対応する塩基情報をアミノ酸配
列に変換)
rRNA(翻訳マシンの中心にあってペプチド結合を形成)
snRNA(スプライシングをおこなうスプライソソームの構成成
分)
Xist(X染色体不活性化RNA)などが知られていた。
(2)機能性RNA
`
ヒトゲノムプロジェクトがもたらした新しい機能性RNAの
発見は、これまでのタンパク質をコードする部分のみを
遺伝子と認識し、タンパク質を通じて遺伝子は機能する
という概念を根底から覆すものであり、コロンブスのアメ
リカ大陸発見にちなんで「RNA新大陸」と呼ばれている。
11
2014/10/6
ポイント
`
`
`
`
`
`
ゲノムとは、生物が生きていくために必要なすべての遺
伝子の1セットのことである。
ヒトは2倍体であるから、父親由来と母親由来の2セット
のゲノムを持つ。
正常ヒト2倍体の染色体数は46本でありその中の44本は
常染色体とよばれる。
ヒトゲノムの全塩基数は約31億塩基対である。
ヒトゲノムにコードされるすべての遺伝子数は、約22,000
個から30,000個である。
ヒトゲノムには反復配列がある。
① SNPとは何か
`
`
`
`
`
ヒトゲノムは、誰であれほとんどの部分が共通のDNA配
列から成り立っているが、所々で差異がみられる。
このDNA配列の差異を遺伝的多型という.
遺伝的多型とは、その変異をもつヒトが、全人類の1%以
上の頻度で存在する場合をさす。
それ以下の頻度のものは単に突然変異とされる。
遺伝的多型の中で、特に一塩基だけが他の塩基に置き
換わった部位をSNP(一塩基変異、一塩基多型)という。
② SNPの分類
`
遺伝子をコードしている領域(エキソン)に見られるSNP
はcSNP(coding SNP)と呼ばれ、アミノ酸配列を変化させ
る可能性が最も高い。
B 一塩基変異(一塩基多型、SNPs)
(p105)
SBO:一塩基変異(SNPs)が、機能に及ぼす影響について概説
できる。
①
`
`
②
`
SNPとは何か
SNP(s)は、英語の一塩基多型Single Nucleotide
Polymorphism(s)の頭文字から命名された。スニップ(ス)
と読む。
SNP(s)はヒト全ゲノム中に約400万から1,000万ヵ所ある
といわれ、SNPが存在する場所によって、タンパク質に与
える影響は異なる。
SNPの分類
イントロンに見られるiSNP(intronic SNP)はmRNAのスプ
ライシングに影響をあたえることがまれに起こる。
12
2014/10/6
② SNPの分類
②
SNPの分類
`
転写調節領域にみられるSNPはrSNP(regulatory SNP)と
いう。
`
uSNP(untranslated SNP)は非翻訳領域に見られるSNPで
ある。
`
転写調節領域は遺伝子の発現量や発現時期を規定して
いる部分なので、遺伝子発現量に影響をあたえ、その結
果、タンパク質の量が変化する可能性がある。
`
非翻訳領域はmRNAの安定性に影響をあたえている。
uSNPの結果、mRNAの安定性が低下すれば、結果とし
て翻訳産物であるタンパク質の量が変化する。
`
② SNPの分類
`
これらの領域以外の部分にみられるSNPはgSNP(
genome SNP)とよばれ、アミノ酸配列などに影響を与え
ることはほとんどない。
ポイント
`
`
`
`
異なるゲノム間を比較したときにみられるゲノムDNAの
差異を遺伝的多型という。
遺伝的多型のうち、ある一塩基が別の塩基に置換して
いるものを一塩基多型(SNPs)という。
ヒトゲノムにSNPsは400万から1,000万種類存在する。
ヒトゲノムにおけるSNPはおよそ1,000塩基対あたり1つ
存在する。
ポイント
`
`
`
`
`
`
cSNPはエクソンに見られ、タンパク質のアミノ酸配列を変
化させる可能性が高い。
iSNPはイントロンに見られ、mRNAのスプライシングに影
響する可能性がある。
rSNPは遺伝子の転写調節領域に見られ、遺伝子発現
量を変化させる可能性がある。
uSNPはmRNAの非翻訳領域に見られ、mRNAの安定
性を変化させる可能性がある。
gSNPはスペーサー領域に見られ、ほとんど影響がない。
SNPは「テーラーメイド医療」を可能にする、個人特有の
遺伝情報である。
13