محققان دادههای ژنتیکی ۱۰۲۱ (در جایی دیگر ۱۰۶۹. مترجم.) داوطلب را تحلیل کردند، که در آنها والدین و همینطور پدربزرگها و مادربزرگها خود را متعلق به یکی از ۱۱ قومیت منتخب ایرانی معرفی نمودند؛ از اقوام بزرگتری چون پارس و آذری گرفته تا گروههای کوچکتری مثل عرب و بلوچ و گیلکی و کرد. این داوطلبان از سراسر ایران نمونهگیری شدند. نتایج نشان داد که به عنوان مثال ایرانیانِ پارسی و کردها، تنوع ژنتیکیِ درونگروهیِ بیشتری نسبت به مثلاً آلمانیها داشتهاند. با این حال احتمال میرود که کل این استخر ژنی، در طول لااقل ۵ هزار سال پیش، و به احتمال بیشتری لااقل از ۱۰ هزار سال پیش به این سو بدون تغییر باقی مانده باشد.
به علاوه نویسندگان، دادههای ژنومی جمعآوری شده را در رابطه با دادههای منتشره از سایر جوامع انسانهای زنده و تقریباً ۸۰۰ نمونه حفاریشده افرادی که هزاران سال پیش در این منطقه و حوالی آن میزیستند، در کنار هم قرار دادند. مایکل نوتنگل خاطرنشان کرد: «دلیل ارزشمند بودن اطلاعات ژنتیکی ایران به ویژه آن است که خلاء دادههای معرف جمعیت و ژنومی جمعیتی بزرگ را در منطقهای مهم از جهان پر میکند.» مجموعه دادههای تولیدشده و الگوهای آشکارکننده آنها، برای تحقیقات بعدی در مورد بیماریهای نادر ژنتیکی و نیز در جهت روشنساختن جنبشهای مهاجرتی گذشته بسیار حائز اهمیت است.
در هزاره گذشته، ایران بارها و بارها با هجوم مهاجرتی مواجه شده است: هند و اروپاییزبانها در آن سکنی گرفتهاند و اعراب نیز از قرن هفتم میلادی به این سرزمین ورود کردند و بعدها هم که ترکزبانان آسیای مرکزی به جمعیت پیوستند. در نتیجه جمعیت امروز ایران متشکل است از گروههای متعدد قومی، مذهبی و زبانی که با درجاتی مختلف با هم ترکیب شدهاند.
به عنوان مثال، با توجه به همپوشانی ژنتیکی قدرتمند کردهای ایرانی با فارسها، لرها و سایر گروههای جمعیتی، که نشان پیشینه مشترک و تا حدودی هم ترکیب کمّی است، به نظر میرسد جزیرهنشینان خلیجفارس بارها مورد هجوم (در معنای ریزش جمعیتی) گروههایی از خارج ایران قرار گرفتهاند. نوتنگل گفت: «اینها با گزارشها تاریخی از تجارت جاری دریایی در هزارههای پیشین مطابقت دارد.» همچنین برخی گروهها، زبان گروههای تازهوارد را پذیرفتند. این مطالعه با ترکیب یافتههای باستانشناسی همراه با آخرین فناوریها در توصیف ژنوم، شواهدی سیستماتیک از این الگوهای مهاجرتی و سکونت ارائه کرد.
تنوع ژنتیکی متمایز و ناهمگنی جمعیت ایران
کشور ایران علیرغم وسعت، موقعیت جغرافیایی و نفوذ فرهنگی دیرینهاش، تا حد زیادی نقطه کوری برای مطالعات ژنتیکی جمعیت انسانی بوده است. مطالعهای که پیش روتان قرار گرفته و سعی شده است بینقص خدمت شما انتقال یابد، مستخرج از مشخصات ژنومی و جغرافیایی کشور ایران بوده، و یافتههای آن براساس ۱۲۰۱ نمونه موردی از یازده گروه قومی به دست آمده است. در این مطالعه نشان داده شده است که ایرانیها، در عین نزدیک بودن به جماعت کشورهای همسایه، تنوع ژنتیکی متمایز و سازگاری تؤام با تداوم ژنتیکی طولانیمدت عرضه میکنند... ناهمگونیشان بالاست و سطوح خویشاوندیشان به همین میزان متفرق و گونهگون. جماعت ایرانی، مجموعهای است از گروههایی مشابه و چندین گروه مختلط... جمعیتی که زبانهای گوناگونی را در دل خود پذیرفته و گذشتهشان نیز آبستن پذیرش زبانهای متعددی در درون خود بوده است.
این یافتهها ایران را به منبع مهمی از تنوع ژنتیکی انسانی در آسیای غربی و مرکزی تبدیل میکند. همانطور که به تفسیر تنوع ژنتیکی احتمالی مرتبط با بیماری نیز میپردازد. با توجه به ناهمگونی ژنتیکی داخلی ایران، مطالعات آینده باید وابستگیهای قومیتی و ترکیبات احتمالی را در نظر داشته باشند.
مقدمه
«ارتفاعات ایران» از زمان پراکنده شدن انسانهای امروزی به خارج از افریقا، به سبب موقعیت ژئواستراتژیکیشان در چهارراه مهاجرتهای انسانی قرار داشتهاند. ایران ضمن اعمال نفوذ فرهنگی گستردهای که به مناطق همسایه داشته است، در هزارههای پیشین بارها مورد هجوم مهاجران نیز قرار گرفته است. از جمله مهاجرت متوالی گروههای از زبانهای هند و اروپایی (IE) به سمت جنوب (مثل سکاها، مادها و پارسها)، ورود اعراب در قرن هفتم پس از میلاد و هجوم متعاقب مردم ترکزبان از آسیای مرکزی.
در نتیجهی مهاجرتها، انشعابات داخلی، اختلاطها و سایر جنبشها، جمعیت امروز ایران شامل گروههای متعدد قومی، مذهبی و زبانی است. به طور عمده فارسها (حدود ۶۵ درصد جمعیت این کشور)، آذریهای ایرانی (۱۶ درصد)، عربها (۲ درصد)، بلوچهای ایرانی (۲ درصد)، ترکمنهای ایرانی (۱ درصد)، قشقایی و سایر گروههای عشایری ترکزبان (۱ درصد) و همچنین ارامنه، آشوریها، گرجیها، یهودیان، زرتشتیان (روی هم کمتر از ۱ درصد) و جمعی دیگر... البته که نسبتهای گزارششده میان منابع مختلف، متفاوت است. تعداد گویشوران یک زبان ایرانی، یعنی هند و اروپایی، زبان یا لهجه زبانی (مثل فارسی، کردی، لری و بلوچی) بسیار بیشتر از شمار گویشوران یک زبان ترکی یا سامی است.
ایران در کمربند کشورهایی واقع شده است که در آنها به طور گسترده ازدواجهای فامیلی اتفاق میافتند. این نمونههای ازدواج، به طور برجستهای در مطالعات مرتبط با بیماری نیز منعکس شدهاند؛ همینطور که شناسایی ژنهای دخیل در بیماریهای اتوزوم مغلوب با تجزیه و تحلیل پیوند و نقشهبرداری اتوزیگوسیتی و کمک به درک علتشناختی عمیقتر از اختلالات پیچیده را نیز تسهیل میکنند. نمونههایی که ارزش این جمعیتها را برای تحقیقات ژنتیکی انسانی نشان میدهند، فراوان هستند؛ مطالعاتی که احتمالش هست در آینده از مطالعه چند خانوار به مطالعات مبتنی بر جمعیت شیفت پیدا کنند.
با این حال میان ایران، سطح خویشاوندی همگنی وجود ندارد. مطالعات اولیه، که نه براساس دادههای ژنتیکی، بلکه بر پایه ارزیابی روابط خانوادگی انجام شده بود، نشان داد که این سطوح میان مناطق جغرافیایی مختلف و بین گروههای قومی مختلف فرق میکند. مطالعهای که در حوالی سالهای ۲۰۱۸ و ۲۰۱۹ براساس ارزیابی روابط خانوادگی انجام گرفت، این نتایج را اصلاح کرد و تفاوتهای فامیلی را براساس استان، منطقه محل سکونت، گروه تولد، ازدواج و نیز سطح تحصیلات افراد گزارش نمود. الگوهای هوزیگوسیتی (ROHها)، یا به اشتراک گذاری هاپلوتیپ از طریق تبار (HBD) میتواند نشانگر اتوزیگوسیتی (تخمیدگی خودکار-خود تخمیدگی) بوده و میان جمعیتها و در مکانهای ژنومی متفاوت باشد؛ مثل فراوانی همخونی و درجه متوسط همبستگی همخونی ژنومی. به علاوه نگاشت اتوزیگوسیتی عمدتاً قادر به تشخیص جهشهای پایهگذار محلی اخیر است. به علاوه فراوانی ناقل بیماریهای مستعد، در مناطق جغرافیایی مختلف ایران شدتهای متفاوتی دارد.
قدری حیرتآور است که آسیای مرکزی و بخشهایی از آسیای غربی، تا حد زیادی نقطه کور مطالعات ژنتیکی غیرپزشکی در دهههای گذشته بودهاند. تا همین اواخر، پروژههای ژنتیکی اختصاصی در زمینه جمعیتهای موجود انسانی و یا تمرکز جهانی و قارهای (در صورت وجود) تنها به طور پراکنده نمونههایی را در ایران شامل میشد و منطقه را به صورت جامع پوشش نمیداد. شایان ذکر اینکه مطالعاتی که نمونههای ایرانی را شامل میشد، اغلب آنها را به عنوان یک جمعیت همگن منفرد و یا نمایندهای از آن در نظر میگرفت.
مطالعات بر روی نمونههای پراکنده DNA باستانی، از دوران نوسنگی اولیه تا کالکولیتیک در ایران، وجود جمعیتهایی را با تمایز ژنتیکی بالا نشان داد که اجداد اروپاییان نبودند، اما در مورد نمونههایی از کوههای زاگرس، قرابتهایی با زرتشتیان داشتند. مطالعه اولیهای که روی گروههای خونی ABO انجام شد، تفاوتهای شدیدی را میان برخی از ۲۱ گروه قومی در نظر گرفته در ایران نشان داد، در حالی که مطالعه دیگری که یک سال بعد منتشر شد و علاوه بر آن، اساسش بر پروتئینهای سرم و آنزیمهای سلولی بود، شواهدی برای زیرساخت جمعیت میان شش گروه شامل [آذریهای ایرانی، کرد، لر، زابلی، بلوچ و زرتشتی] با میانگین امتیاز ۰.۰۲ برای FST، بر پایه گروههای خونی، پروتئینهای سرم و آنزیمهای سلولی و درجاتی از همخونی ارائه کرد. مطالعات متمرکز منطقهای بیشتر بر روی ایران، براساس نشانگرهای تکوالدینی نظیر هاپلوتیپهای کروموزومی Y و هاپلوتیپهای نشانگر تکرار کوتاه پشتسر هم (STR) و نیز هاپلوگروههای میتوکندری (mtDNA)، درجات بالایی از تنوع ژنتیکی را در جمعیت ایرانی تأیید کردند. این مطالعات، تغییرات مربوطه را عمدتاً دارای منشأ اوراسیای غربی گزارش کردند، و تنها تعداد محدودی را متعلق به اوراسیا شرقی، آسیای جنوبی و افریقا، که بیشتر هم در استانهای جنوبی ایران دیده میشد، دانستند. این مطالعات همچنین جریان ژنی و باستانی اخیر را میان ایران و شبهجزیره عربستان، یک رابطه نزدیک و شگفتانگیز میان ایرانیان و قشقاییهای ترکزبان ایرانی و به طور کلی سطوح بالایی از تنوع قابل مقایسه با تغییرات در قفقاز جنوبی، آناتولی و اروپا گزارش دادند. این مشاهدات همهشان از این تصور که ایران چهارراه مهاجرتهای انسانی را تشکیل میدهد، حمایت میکند. مطالعهای که روی ارامنه واقع در شمال ایران انجام شد، رویدادهای ترکیبی متعدد و نقش کلی را به عنوان پلی میان مناطق مختلف جغرافیایی پیشنهاد داد.
تعدادی از مطالعات، با استفاده از دادههای ژنوتیپ گسترده ژنوم یا اگزوم، تعدادی از مطالعات نمونههای جمعیتی را که میشد به عنوان نماینده گروههای قومی در ایران از کشورهای اطراف در نظر گرفت، مورد تجزیه و تحلیل قرار دادند. در مطالعهای که روی ۱۵۶ نفر انجام شد، جمعیت قطر، سه گروه مجزا را گزارش کرد که یکیشان (Q۲) میل و بستگی زیادی با ایرانیها و الگوهای اختلاط داشت. مطالعهای بر روی ۲۲ کویتیِ دارای اصل و نسب ایرانی، سطوح نسبتاً بالایی از تنوع ژنتیکی را برای یک جمعیت غیرافریقایی نشان داد که با رویدادهای ترکیبی پیش نیز قابل توضیح است. مطالعه بر روی ۴۳ فرد متعلق به پارسیان، که یک جامعه دینی زرتشتی در هند و پاکستان است، میل ژنتیکی نزدیکتری به جمعیتهای امروزی ایران و قفقاز، نسبت به جمعیتهای جنوب آسیا نشان داد. اما شباهتی که به نمونههای DNA دوران نوسنگی ایران، در مقایسه با ایرانیان مدرن داشت، هم با سوابق تاریخی مهاجرت به جنوب ناشی از ورود اعراب به ایران در قرن هفتم و هم با رویدادهای اخیر آمیختگی با جمعیت مدرن ایران مطابقت داشت. تکمیلکنندهی این نتایج، یافتههایی بودند که افزایش همگنی و تاریخگذاری رویدادهای اختلاط پیشین را در نمونههای بیشتر زرتشتیان ایرانی و هندی نشان میدادند. تجزیه و تحلیل ۲۴ نفر از کلاس هند و اروپایی زبان (منظور جمعیت ایزولهشده در هندوکش، افغانستان)، نشاندهنده یک جمعیت باستانی اوراسیای شمالی است که از نظر ژنتیکی دچار تغیر و انحراف شده؛ این جماعت در اوایل دوران نوسنگی تقسیم شده و متعاقباً به سوی جنوب مهاجرت کردهاند. و در نهایت نیز مطالعهای که همان اواخر انجام شد، محدود گردید به دادههای اگزومی که ۸۷ نمونه ایرانی را با ۱۳۶ نمونه پاکستانی ادغام میکرد... نتیجهی به دست آمده، در مقایسه با سایر جمعیتهای مغرب و شبهجزیره عربستان از راه ترکیه، موضعی تا حدی افراطی و شاید منزوی را نشان داد. با این حال هیچیک از این مطالعات تا این لحظه نه به طور مستقیم و نه در حالت مقایسهای، اقوام ایران را مورد بررسی قرار نداده است.
همبستگیای که میان نزدیکی ژنتیکی و زبانی جمعیتها وجود دارد، اغلب به عنوان یک قاعده فرض شده است، در حالی که پذیرش زبان معمولاً به عنوان استثنائی از قاعده تکامل مشترک در نظر گرفته میشود، اگرچه چنین ادعاهایی بارها مورد مناقشه قرار گرفتهاند. شواهد چنین همبستگیهایی در اروپا زیادند، از جمله دادههای اتوزومی و میتوکندری، دادههای کروموزومی، و حتی عطف به گسترشی که در زبانهای هند و اروپایی در اروپا رخ داده است: دادههای DNA باستانی. مطالعات عمیق در سایر نقاط دنیا نشان میدهند که میان پراکندگی زبان با دودمانهای کروموزومی ارتباط وجود دارد. هر چند که این ارتباط در تمام بخشها دیده نمیشود. علاوه بر این برخی موارد ژن با واسطه مرد، از برخی موانع اصلی زبانی نیز عبور کرده است. یکی از مطالعات اولیه، پیشتر ارتباط ژنتیکی نزدیکی را میان گروههای سامیزبان و هندواروپاییزبان در ایران مشاهده کرده بود. مطالعاتی که روی ارمنستانِ همسایه انجام شد، به شواهدی برای رویداد جایگزینی زبان دست پیدا کرد که احتمالاً با اختلاط چندین جمعیت منبع در طول دوران برنز تسهیل شده است. با این حال، رابطه میان نزدیکی ژنتیکی و زبانی برای ایران و کشورهای همسایه، به ندرت موضوعی بوده که مورد بررسی قرار گرفته باشد.
در حالی که به نظر میرسد ایران قرار است سهم مهم دیگری را در تحقیقات ژنتیک انسانی بازی کند، طراحی و تفسیر کافی از مطالعات ژنتیکی پزشکی و جمعیتی آینده، نقشی الزامی جهت دستیابی به یافتههای قابل تفسیر دارد. ما در اینجا به صورت جامع تنوع ژنومی ۱۱ گروه قومی ایران، ارتباطشان با یکدیگر و همچنین با جمعیتهای مرجع جهانی و محلی را مورد تجزیه و تحلیل قرار دادیم. به علاوه، براساس قومیت، سطوح همبستگی، توزیع نواحی هموزیگوت و شماره مناطق و CNVها و همچنین میزان طبقهبندی جمعیتی در ایران و آثار احتمالی در مطالعات ارتباطی و نیز ارتباط میان خانواده زبان گفتاری و نزدیکی ژنتیکی بررسی انجام دادیم.
نتایج
در اینجا مجموعهای از دادههای ژنومی را که شامل ۱۰۲۱ فرد از ۱۱ گروه قومی اصلی و ساکن ایران بود، گرد آوردیم (جدول ۱). این مجموعه دادههای ایرانی، جهت مقایسه یا جمعیتهای موجود، با نمونههایی از پروژه ۱۰۰۰ ژنوم (۱۰۰۰G)، و یا با نمونههای سه مطالعه اخیر با تمرکز منطقهای ادغام شد؛ گروهبندیها اغلب براساس منطقه جغرافیایی بود (جدول S۱) و یا خانواده زبانی (جدول S۲). ما همچنین ۷۹۸ نمونه DNA باستانی انسانی را از ۲۱ نشریه مختلف برای تجزیه و تحلیل مکانی-زمانی گردآوری کردیم (جداول S۳ و S۴).