2014/10/6 第一薬科大学 3年生 祝日の振替講義 講義しません。 10月11日(土)、10月18日(土)、11月1日(土) 『分子生物学』 後期 第3回 講義する。 11月21日(金) 分子生物学教室 担当:荒牧弘範 (H26.10.6) ③ ` ` ` ` ` 非コード領域を埋める反復配列 (p91) DNAを制限酵素で切断するとDNAが断片化する。 その混合物を密度勾配遠心にかけ分離すると、大部分 のDNA断片は一つの主ピークに集まる。 それより密度が少しずれて、小さなピークを形成するの がサテライトDNAである。 サテライトDNAは縦列反復配列と呼ばれるものの一つ である。 これに対して、一定の長さの配列をした転移性DNA因 子(トランスポゾン)がゲノム上に分散して存在している。 それらを分散型反復配列と呼んでいる。 a.縦列反復配列 ` ある位置の反復配列の反復回数が個人によって異なっ ていることから、マイクロサテライトDNAは個人の識別に 利用されたりする。 a.縦列反復配列(p91) ` ` ` サテライトDNAはセントロメアに多く、動原体の形成や複 製の制御に関係すると見られている。 ミニサテライトDNAとしては、テロメアのTTAGGG繰返し 配列がある。 (CA)/((TG)のような2塩基反復配列やAやTの1 塩基反 復配列に代表されるマイクロサテライトDNAは、ゲノム 上に広く分布している。 a.縦列反復配列 ` このような反復配列の部位では、スリップ複製により反 復配列が伸長したり欠失したりしやすい。 1 2014/10/6 b.分散型反復配列(p91) ` ` 真核生物では、DNA上の 反復配列から転写された RNAが逆転写酵素により 二本鎖DNAに変換される 。 ゲノム中に再び取り込ま れることにより生じたレト ロトランスポゾンが大半で ある(図5・6a)。 (1)Alu配列とLINE-1 (p91) ` ` ` レトロトランスポゾンの中で重要なのは、Alu配列とLINE1である。 Alu配列の中には現在も活発に転写されているものがあ る。 LINE-1のうちの100個が今も転移能をもっており、遺伝子 を破壊して疾患を引き起したことが報告されている。 b.分散型反復配列 ` ` (1)Alu配列 ` ` ` ` (1)LINE-1 ` ` LINE-1は、長い分散型反復配列(LINE; long interspersed nuclear element)の一種である。RNAポリメラーゼⅡが 配列の末端にあるプロモーターに結合し、転写を開始す る。 LINE-1がコードする逆転写酵素が、Alu配列の転移や後 述する偽遺伝子の生成など、細胞内でおきる逆転写反 応に関与している。 興味深いことに、分散型反復配列である転移性DNA因 子の配列の総和は、ゲノム全体の45%にもなることがわ かった。 それらの大部分は、大昔は転移能を持っていたが現在 では活性をなくし、化石のような存在となっている。 Alu配列は、短い分散型反復配列(SINE; short interspersed nuclear element)の一種である。 約300塩基の長さで内部に制限酵素Aluの切断部位があ ることから名付けられた。 Alu配列内部のプロモーターにRNAポリメラーゼⅢが結 合し、転写を開始する。 Alu配列は、シグナル認識粒子中の7SL RNAに由来して いるが、逆転写酵素はコードしていない。 (2)DNA型トランスポゾン(p92) ` ` DNA型トランスポゾンは 自身を切り出すか複製し て標的DNAに転移する が、ヒトでは現在は活性を 失ってしまっている。 しかし、組換え酵素やセ ントロメア結合タンパク質 をコードする遺伝子は今 も機能しており、それらは DNA型トランスポゾンに 由来している(図5・6b)。 2 2014/10/6 ポイント ` ` ` 遺伝子の本体はDNAであり、生殖細胞(配偶子)の全 DNA(核DNAとオルガネラDNA)がゲノムである。 ゲノムには、タンパク質のアミノ酸配列の情報をコードす る遺伝子の他、機能性 RNAの遺伝子が存在している。 ゲノムの非コード領域には、縦列反復配列や分散型反 復配列などの要素が見つかり、それらの意味が注目さ れている。 ①タンパク質のモジュール構造(p93) ` ` C.遺伝子の進化 (p93) ` ` ② ` ` エキソンシャッフリング(p93) エキソンシャッフリングでエキソンが付加すると、生じた 遺伝子から転写・翻訳されるタンパク質に、タンパク質同 士が相互作用する場が追加される。 このような相互作用が増えれば新たな機能や調節機構 が付け加わるので、転写・翻訳される遺伝子数の少なさ を補えることになる。 個々のエキソンに由来するアミノ酸配列は、高次構造を 組立てる素材の単位モジュールとして働いているという 考え方がある。 それによると、タンパク質はこれら素材単位の組み合わ せで出来上がっていることになる。 遺伝子の進化も、エキソンを組換えたり追加したりして素 材の単位を付加するほうが、点突然変異でコドンを変化 させてアミノ酸残基の置換を引き起すよりもずっと効果 的である。 このようにエキソンが組み換わる現象を、エキソンシャッ フリングと呼ぶ。 a.レトロ転移によるエキソンシャッフリング (p93) ` レトロ転移とは、細胞内の mRNAが逆転写されて相 補的なDNAとなり、染色 体の新たな位置に組込ま れることである。 ` 長い分散型反復配列であ るLINE-1の配列内に存在 するポリA付加シグナル の機能は弱い。 3 2014/10/6 ヒトβ-グロビン遺伝子の構成 a.レトロ転移によるエキソンシャッフリング (p93) ` ` このため、ある遺伝子の イントロン内にはいり込ん だLINE-1の転写が起きる 時、転写が近傍のエキソ ン配列まで進むことがあ る。 このような場合、本来の LINE-1の配列にエキソン 部分が付加した融合 mRNAが生成する。 転写領域は3つのエクソン(赤)と2つのイントロンで構成される。 a.レトロ転移によるエキソンシャッフリング (p93) ` このmRNAが逆転写され た二本鎖DNAが、別の遺 伝子や同じ遺伝子のイン トロンに挿入されると、エ キソンが追加されることに なる。 b.不等交叉によるエキソンシャッフリング (p94) ` ` ` ③ ` ` ` 遺伝子重複 (p94) エキソンシャッフリングは、 遺伝子内の不等交叉が原 因で生じる場合がある。 遺伝子の複製時、類似配 列が存在するとその部分で 交叉が起きる。 複数の類似配列があると 不等交叉の原因となり、エ キソンが追加された長い染 色体と、エキソンを失った 短い染色体が生じる(図5・ 8a)。 ③ 遺伝子重複 (p94) 遺伝子にコードされるタンパク質の構造や基本的な機能 がほとんど同じで、生理的役割が異なる遺伝子をグルー プ分けすることが可能である。 それらを遺伝子ファミリーと呼んでいる。 薬理作用や医薬品の標的としても重要な、7回細胞膜を 横切るGタンパク質共役型の受容体も、遺伝子ファミリー を構成している。 4 2014/10/6 ③ ` 遺伝子重複 (p94) 遺伝子ファミリーが存在 するのは、エキソンシャッ フリングに加え、遺伝子 が重複して増えてきたか らである(図5・8b)。 ③ ` ` ` ` ヒトとチンパンジーのゲノムと遺伝子 ` ` ` ヒトとチンパンジーはおよそ700万年ぐらい前に分岐した と考えられています。 700万年ぐらい前にはヒトとチンパンジーの共通の祖先 種がいて、その種が暮らしていたわけです。 それがある条件下で分かれ、ヒトとチンパンジーにそれ ぞれ進化してきたわけです。 オーソログ ` ` オーソログ遺伝子はヒトとチンパンジーと種が違っていて も、塩基配列には高い相同製を持っていますので、その 遺伝子由来のタンパク質には共通の機能を持つことが 多い。 このオーソログな遺伝子を、ヒトとチンパンジーに限らず 、酵母から植物や動物などいろいろな種で見つけると、 その遺伝子Aの塩基配列やアミノ酸配列を見比較するこ とで進化の過程を推定したり、あるいは種によっては機 能のわかってない遺伝子の働きを推定したりすることが できます。 遺伝子重複 (p94) 重複した遺伝子はもともとの遺伝子が既に存在すること から、変異を蓄積しやすい。 その結果、転写されなくなったり、転写されても機能する タンパク質を生成できなくなったりして、偽遺伝子として 名残をゲノム上に残すことになる。 ヒトゲノム上には多くの偽遺伝子が存在することから、遺 伝子重複は頻繁に起きていたと推定される。 遺伝子重複は、エキソンシャッフリングとともに、タンパク 質が新たな機能を付加したり獲得したりするのに役立っ た。 オーソログ ` ヒトとチンパンジーの共通祖先が持っていたある遺伝子 Aに注目し、その遺伝子Aが進化の過程で、つまり700万 年の間に突然変異などで変化し、現在のヒトの遺伝子AHやチンパンジーの遺伝子A-Cになった場合、その遺伝 子A-Hと遺伝子A-Cをオーソログといいます。 パラログ ` ` ` あるひとつのゲノムの中で、遺伝子の重複が起こり、あ る遺伝子が複製されることがあります。 その複製によってできた類縁関係にある遺伝子のことを パラログといいます。 これも、進化の過程で重複があった時点からの時間に 依存して、突然変異などによって塩基配列が変化します ので、重複が起こったときは同じ配列ですが、そのうち異 なる配列になります。 しかし、よく似た配列であって、その遺伝子由来のタンパ ク質の機能もよく似ているはずです。 5 2014/10/6 a.レトロ遺伝子(p95) ` ` ` a.レトロ遺伝子(p95) ` ` このような遺伝子をレトロ 遺伝子と呼び、イントロン がない(図5・6a)。 ゲノム中に見つかるイント ロンのない遺伝子の中に は、このような機構で生じ たものがあると考えられ ている。 b.不等交叉による遺伝子重複(p96) ` ` グロビン遺伝子のクラスターが存在するのは、遺伝子重 複が起きたことを示す良い例である。 今から8億年前のグロビン遺伝子の祖先遺伝子は単 量体グロビンをコードしていた。 LINE由来の逆転写酵素 が発現すると、細胞内に 存在する転写後の成熟 mRNAを鋳型にして二本 鎖DNAが合成される。 このDNAがゲノム中に再 び組込まれたものを、レト ロトランスポゾンという。 組み込まれた先が、ある 遺伝子のプロモーター配 列の近傍だった場合には 、発現する遺伝子となる。 b.不等交叉による遺伝子重複(p95) ` 遺伝子の重複は染色体 の不等交叉によっても生 じる。図5・8bに示したよう に、染色分体が不等交叉 によって組換えを起すと、 片方は遺伝子が重複し、 片方は遺伝子が欠失した 染色体が生成する。 b.不等交叉による遺伝子重複(p96) ` ` 5億年前には四量体グロビンの祖先遺伝子が生じた。 その後、5億年前にαとβグロビン遺伝子に分かれ、それぞれ がさらに遺伝子重複によって進化してきた(図5・9)。 6 2014/10/6 b.不等交叉による遺伝子重複 ` ` ` 現在ヒトのαグロビン遺伝子のクラスターでは、ζの下流に全く 等しいα遺伝子が2個並んでいる。 また、βグロビン遺伝子のクラスターでは、ほとんど同じγGと γAが並んでいる。 へモグロビンはαタイプとβタイプのグロビンが2分子ずつ四量 体に集合したもので、酸素の運搬を行う。 ポイント ` ` ` エキソンはタンパク質の構造を組立てるモジュールとし て働く。 エキソンシャッフリングや遺伝子重複はレトロ転移や不 等交叉により生じる。 グロビン遺伝子の進化には遺伝子重複が寄与した。 6章 ヒトゲノム (p95) SBO:ヒトゲノムの構造と多様性について説明できる。 7 2014/10/6 a ゲノム(図6・1) ` ` ` ヒトは2倍体生物であるから、ゲノム情報を2セットもって いる。 1セットは母親から受け継いだもの(図6-1では青色で示 した各染色体)であり、もう1セットは父親から受け継いだ もの(図6-1では灰色で示した各染色体)である. これらは互いに相同染色体という. A ゲノムとは何か ①ヒトゲノム a ゲノム ` ` ` ヒト染色体数は常染色体 が22対で44本であり、性 染色体が1対、2本で合わ せて46本存在する. Y染色体には男性となる ことを決定する遺伝子が コードされているのでY染 色体を持つものが男子と なる. したがって44+XYが男子 、44+XXが女子である. b.ヒトゲノムプロジェクト(p100) ` 1985年に米国でヒトゲノ ムの全DNA塩基配列を 決定することが提案され た(図6・3). (p99) a ゲノム ` 染色体には、遺伝子と遺伝子をつなぐ領域(スペーサー 領域)や、イントロン、セントロメア、テロメアなど遺伝子を コードしていない領域や、後述する反復配列なども存在 するがそれらすべての領域を含めてゲノムという(図6・2 ) b.ヒトゲノムプロジェクト(p100) ` ` 当時は技術的、金銭的な問題等があって計画はなかな か進まなかったが、DNAの塩基配列決定法を開発した ギルバートやDNAの立体構造を解明したワトソンなどの ノーベル賞を受賞した著名な科学者たちがヒトゲノムプ ロジェクトに積極的に参加し推進した。 のちに日中米欧を含む国際コンソーシアムが作られ、世 界中が参画する巨大プロジェクトに発展し、日本もヒトゲ ノムプロジェクトに大きく貢献した。 8 2014/10/6 b.ヒトゲノムプロジェクト(p100) ` ` ` この間に、大腸菌、パン酵母、線虫、ショウジョウバエな どの、古くから生命科学研究に用いられてきたモデル生 物の全ゲノムDNA塩基配列が解読された。 これに伴い、DNAの塩基配列決定技術が飛躍的に向上 した。 特筆すべき出来事は、ヒトゲノムプロジェクトが進行する 過程で民間企業がそれまでとは異なる手法を用いてコ ストを抑えてゲノムプロジェクトに参入してきたことである 。 b.ヒトゲノムプロジェクト ` ` ` ` それまでは1996年に成立したバミューダ原則にしたがっ てヒトゲノムプロジェクトで得られた成果は公表されてい た。 バミューダ原則とは、ヒトゲノム配列は公共の財産なの で解読したらただちに公表する、という原則である。 これに対して新規参入側はバミューダ原則を無視して、 決定した配列は公表せず、希望する製薬会社や団体に 販売すると宣言した。 このことは、ヒトゲノムの情報が特定団体に占有される 危険があることを示していた。 b.ヒトゲノムプロジェクト ` この発表を受けて国際コ ンソーシアムにおけるヒト ゲノム計画はDNA配列決 定を加速し、ついに2001 年2月2日にはヒトゲノム の概要版が発表され、 2004年10月には国際コン ソーシアムによる最終版 が発表された(図6・3) 。 c.ゲノムサイズと遺伝子の数(p102) ` ` ` ヒトゲノムマップ ` ヒトの染色体は、どれも直鎖状構造をしている。 ヒト1倍体(卵や精子)に含まれるDNA塩基数をゲノムサ イズといい、ヒトの場合約31億(3.1ギガ)塩基対になる。 パン酵母は約12メガ塩基対、結核菌は約4.4Mメガ塩基 対となる。 ヒトの約31億塩基対のゲノムには、約22,000個から 30,000個のタンパク質をコードする遺伝子が存在する。 http://www.pcost.or.jp/pg42.html 9 2014/10/6 c.ゲノムサイズと遺伝子の数(p102) ` ` ` ` 生物は、体制が複雑になるほど多くの遺伝子が必要に なるのでゲノムサイズも大きくなる傾向にある。 たとえば、細菌の一種である大腸菌(Escherichia coli K-12 )のゲノムサイズは約4.6メガ塩基対で遺伝子数は約 4,400個、 単細胞の真核生物であるパン酵母(Saccharomyces cerevisiae)のゲノムサイズは約12メガ塩基対で遺伝子数 は約6,300個、 昆虫の一種であるショウジョウバエ(Drosophila melanogaster)のゲノムサイズは約120メガ塩基対で遺伝 子数は約13,600個である(図6・4) 。 d.ヒトゲノムにコードされた遺伝子の数 (p103) ` ` ` ` d.ヒトゲノムにコードされた遺伝子の数 ` この矛盾は、1つの遺伝子からmRNAが転写される際に 選択的スプライシング(p52)と呼ばれる現象によって、数 種類のmRNAが生じ、それらを元にアミノ酸配列の異な った数種類のタンパク質が生じることが明らかになったこ とで理解された。 ヒトの全ゲノムDNAの塩基配列の解読が終了する以前 は、ヒトのタンパク質をコードする遺伝子数は10万前後 であろうといわれていた。 しかし、ヒトゲノムプロジェクトの結果、ヒトゲノムにコード される遺伝子数は22,000-30,000個であるという結果が 得られた。 この数は、予想された数よりもはるかに少ないものであ った。 ヒトの細胞にはこれよりはるかに多くのタンパク質が存 在することが分かっていた。 e.ヒトゲノムのいくつかの領域(p104) ` ゲノムにはエクソン、イントロンからなる遺伝子部分や、 それらを制御しているプロモーター領域、遺伝子と遺伝 子をつないでいるスペーサー領域が存在することはヒト に限らず全ての生物のゲノムで共通であるが、そのほか にもヒトゲノムにはいくつかの特徴的な領域が存在する ことが明らかとなった。 10 2014/10/6 (1)反復配列(p104) ` ` ゲノムには、遺伝子をコードする領域や、その上流と下 流に存在する調節領域のほかに、他の真核生物のゲノ ム同様にマイクロサテライトや、ミニサテライトVNTR( Variable Number of Tandem Repeat)といった反復配列が 存在する。 反復配列は各個人で反復数が異なっている場合があり 、ヒトゲノムの多様性にも関与する。 (2)機能性RNA(p104) ` ` ` ヒトゲノムプロジェクトによるゲノムDNA塩基配列の決定 では、遺伝子をコードする領域を同定することが目標の 1つであった。 このため、mRNAから合成したcDNAを網羅的に解析し て遺伝子コード領域、とくにエクソン部分を同定するため のプロジェクトが進められた。 当初は遺伝子をコードする領域を同定することを目的と したが、解析が進むにつれて、本来遺伝子をコードして いないはずの領域からもRNAが転写されており、これら が遺伝子発現制御や、ある種の疾患にも関与する可能 性が出てきた。 (2)機能性RNA ` ` ` ゲノムプロジェクトではそれらに加えて新たな機能性 RNAが大量に存在することが示された。 さらに、タンパク質をコードせずに未知の機能を持つ機 能性RNAが転写される領域は、ゲノムの非遺伝子コード 領域の約7割にも及ぶことがわかった. この量は、上記のエクソン部分が全ゲノムの1.5%ほどし かないことと比較して圧倒的に多いことがわかる。 (1)反復配列 ` ` ` 反復配列はヒトゲノムのうち の45%近くにおよぶ。 つまり、ヒト1倍体ゲノムの 31億塩基対のうちほぼ半分 が、タンパク質をコードして いない反復配列で占められ ていることになる。 さらに、スペーサー領域や イントロンも加えると、ヒトゲ ノムDNAにおいて遺伝子を コードしている領域(エクソ ン部分)は全体の1.5%ほど しかないと考えられている( 図6・5)。 (2)機能性RNA ` タンパク質をコードしないが細胞内で何らかの機能を持 つRNA(機能性RNA non-coding RNA;ncRNA,p88)とし ては、以前から ` ` ` ` tRNA(mRNAのトリプレットに対応する塩基情報をアミノ酸配 列に変換) rRNA(翻訳マシンの中心にあってペプチド結合を形成) snRNA(スプライシングをおこなうスプライソソームの構成成 分) Xist(X染色体不活性化RNA)などが知られていた。 (2)機能性RNA ` ヒトゲノムプロジェクトがもたらした新しい機能性RNAの 発見は、これまでのタンパク質をコードする部分のみを 遺伝子と認識し、タンパク質を通じて遺伝子は機能する という概念を根底から覆すものであり、コロンブスのアメ リカ大陸発見にちなんで「RNA新大陸」と呼ばれている。 11 2014/10/6 ポイント ` ` ` ` ` ` ゲノムとは、生物が生きていくために必要なすべての遺 伝子の1セットのことである。 ヒトは2倍体であるから、父親由来と母親由来の2セット のゲノムを持つ。 正常ヒト2倍体の染色体数は46本でありその中の44本は 常染色体とよばれる。 ヒトゲノムの全塩基数は約31億塩基対である。 ヒトゲノムにコードされるすべての遺伝子数は、約22,000 個から30,000個である。 ヒトゲノムには反復配列がある。 ① SNPとは何か ` ` ` ` ` ヒトゲノムは、誰であれほとんどの部分が共通のDNA配 列から成り立っているが、所々で差異がみられる。 このDNA配列の差異を遺伝的多型という. 遺伝的多型とは、その変異をもつヒトが、全人類の1%以 上の頻度で存在する場合をさす。 それ以下の頻度のものは単に突然変異とされる。 遺伝的多型の中で、特に一塩基だけが他の塩基に置き 換わった部位をSNP(一塩基変異、一塩基多型)という。 ② SNPの分類 ` 遺伝子をコードしている領域(エキソン)に見られるSNP はcSNP(coding SNP)と呼ばれ、アミノ酸配列を変化させ る可能性が最も高い。 B 一塩基変異(一塩基多型、SNPs) (p105) SBO:一塩基変異(SNPs)が、機能に及ぼす影響について概説 できる。 ① ` ` ② ` SNPとは何か SNP(s)は、英語の一塩基多型Single Nucleotide Polymorphism(s)の頭文字から命名された。スニップ(ス) と読む。 SNP(s)はヒト全ゲノム中に約400万から1,000万ヵ所ある といわれ、SNPが存在する場所によって、タンパク質に与 える影響は異なる。 SNPの分類 イントロンに見られるiSNP(intronic SNP)はmRNAのスプ ライシングに影響をあたえることがまれに起こる。 12 2014/10/6 ② SNPの分類 ② SNPの分類 ` 転写調節領域にみられるSNPはrSNP(regulatory SNP)と いう。 ` uSNP(untranslated SNP)は非翻訳領域に見られるSNPで ある。 ` 転写調節領域は遺伝子の発現量や発現時期を規定して いる部分なので、遺伝子発現量に影響をあたえ、その結 果、タンパク質の量が変化する可能性がある。 ` 非翻訳領域はmRNAの安定性に影響をあたえている。 uSNPの結果、mRNAの安定性が低下すれば、結果とし て翻訳産物であるタンパク質の量が変化する。 ` ② SNPの分類 ` これらの領域以外の部分にみられるSNPはgSNP( genome SNP)とよばれ、アミノ酸配列などに影響を与え ることはほとんどない。 ポイント ` ` ` ` 異なるゲノム間を比較したときにみられるゲノムDNAの 差異を遺伝的多型という。 遺伝的多型のうち、ある一塩基が別の塩基に置換して いるものを一塩基多型(SNPs)という。 ヒトゲノムにSNPsは400万から1,000万種類存在する。 ヒトゲノムにおけるSNPはおよそ1,000塩基対あたり1つ 存在する。 ポイント ` ` ` ` ` ` cSNPはエクソンに見られ、タンパク質のアミノ酸配列を変 化させる可能性が高い。 iSNPはイントロンに見られ、mRNAのスプライシングに影 響する可能性がある。 rSNPは遺伝子の転写調節領域に見られ、遺伝子発現 量を変化させる可能性がある。 uSNPはmRNAの非翻訳領域に見られ、mRNAの安定 性を変化させる可能性がある。 gSNPはスペーサー領域に見られ、ほとんど影響がない。 SNPは「テーラーメイド医療」を可能にする、個人特有の 遺伝情報である。 13
© Copyright 2024 Paperzz