Кухулин
Потребител-
Брой отговори
5366 -
Регистрация
-
Последен вход
-
Days Won
16
Content Type
Профили
Форуми
Библиотека
Articles
Блогове
ВСИЧКО ПУБЛИКУВАНО ОТ Кухулин
-
Сега погледнах пак началото на темата. Не мога много ясно да разбера каква е тезата, но връзката на съвременните българи с Капитан Андреево и със сарматите се доказва достатъчно просто: > result_f3 = f3 ("C:/AdmixTools/Dataset/v54.1.p1_HO_public", verbose = T, + "Bulgarian.HO", + "BGR_KapitanAndreevo_IA", + "RUS_Sarmatian") ℹ Computing from f3 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 593124 SNPs... ℹ Computing 1 f3-statistics for block 711 out of 711... ℹ Summarize across blocks... > result_f3 # A tibble: 1 × 8 pop1 pop2 pop3 est se z p n <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 Bulgarian.HO BGR_KapitanAndreevo_IA RUS_Sarmatian -0.00247 0.000442 -5.60 0.0000000220 562811 > Друг е въпросът, че КА не е директен компонент, дори само по хронологични причини. Връзката явно минава през по-късни популации, според мен близки до BGR_Anc и BGR_RomByz.
-
Тъкмо днес гледах някакви статистически примери с неандерталци от пещерата Виндия и хоп - Дробишевски пак избухна 24:45
-
При по-сериозна проверка аутгруп-ф3 статистиката показа, че хърватското и джулюнишкото желязо имат по-висок месопотамски компонент от Розово. Тоест аргумент номер 3 е невалиден. Пълен код: > result_f3 = f3 ("C:/AdmixTools/Dataset/v54.1.p1_1240K_public", verbose = T, + c ("Mbuti.DG"), + c ("Mesopotamia"), + c ("SRB_Iron_Gates_HG", + "BGR_Dzhulyunitsa_IA", + "HRV_IA", + "BGR_Anc", + "GBR_England_Bell_Beaker")) ℹ Computing from f3 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 1150639 SNPs... ℹ Computing 5 f3-statistics for block 713 out of 713... ℹ Summarize across blocks... > result_f3[order(result_f3$est),] # A tibble: 5 × 8 pop1 pop2 pop3 est se z p n <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 Mbuti.DG Mesopotamia SRB_Iron_Gates_HG 0.269 0.00227 119. 0 861146 2 Mbuti.DG Mesopotamia GBR_England_Bell_Beaker 0.276 0.00220 126. 0 857898 3 Mbuti.DG Mesopotamia BGR_Anc 0.279 0.00291 95.7 0 346647 4 Mbuti.DG Mesopotamia HRV_IA 0.279 0.00230 122. 0 785255 5 Mbuti.DG Mesopotamia BGR_Dzhulyunitsa_IA 0.283 0.00273 104. 0 605558 > Аргумент номер 2 също не е валиден, тъй като 5-компонентният модел не е възпроизводим. И в ф4 статистиките липсва завишен дисбаланс КЛС-ИЕЛС. С други думи на този етап няма обективни причини да разглеждаме Розово отделно от местното желязо.
-
Според мен на този етап е рано да се правят някакви генерални изводи за ролята на кавказките алани в българския микс. Много голяма част от досегашните анализи се основаваха върху работите на Дамгаар и Лазаридис - съответно високия КЛС-компонент в аланите и 5-компонентния модел на българите. При по-сериозна проверка нищо от това не се потвърждава. Нито кавказките алани на Дамгаар са с висок КЛС, нито нашият 5-компонентен модел може да се възпроизведе що-годе надеждно. Следователно трябва да разчитаме изцяло на собствените си сили, които за съжаление не са в някаква пикова фаза Какво показват лично за мен скромните ми занимавки с адмикстулса? Показват, че цялата стабилност на моделите се крепи върху славяните и местния дославянски компонент. Там са високите проценти, там е солидната статистическа значимост - устойчиво над 3 сигма. Останалите компоненти са гола вода - алани, сармати, хунну, мунну - всичко е под 3 и играе в процентите, както си иска. А най-лошото е, че тези плаващи алано-хунски компоненти са представени от многобройни и качествени проби. И въпреки това не могат да генерират статистическа значимост. А славяните и особено нашенците са еднични проби на някакъв остатъчен принцип - тоя оттук, оня оттам, понякога с мизерни снипове. И дават 4-5-7 зет. Чак срам да го хване човек. Извод: всяка нова българска проба от дославянския период може коренно да измени картината. Трябва да се формира ясна антична популация, за да видим кой е ядро, кой е аутлаер и т. н. Тогава вече ще можем да смятаме моделите на по-стабилна основа. А след това да ги сравняваме с пробите от прабългарските погребения и да си чешем езиците Е те тогава ще се излеят мазните потоци "интернет-критика" от всякакъв вид форумни анализатори. Това днешното нищо не е. Аз ако съм на Южняка, ще си взема отпуска
-
Не, не съм го ползвал. Има ли някаква реална полза от него?
-
Още един, този път с Розово. И покрай тази проба се очертава интересна ситуация, но още не съм я гледал под лупа като византиеца.
-
За теб винаги. Горе-долу читав модел с кавказките алани от таблицата в другия форум: Както писах и там, с византиеца всичко се получава много гладко. Не знам обаче какво ще е положението, като излязат новите руски изследвания. Предварителните данни, които постна genefan, показват доста голяма разлика между "нашите" кавказки алани и техните. Пълен код на модела:
-
Е така е, ама ако не става иначе... Като се разминат сниповете, няма начин. Шимпанзето много го обича тоя номер. Българските проби също са капризни. Освен това има и друг момент - много хора са твърдо против алснипс в адмикса, защото изкривява ф4. Обаче е по-лесно. Лазаридис например го ползва. Аз засега нямам мнение. Аварските славяни адмиксът си ги хареса, аз бях пъхнал няколко вида. Пък и славяни като славяни, какво им е? Виж, за Кракауер Берг (KRA001 и другите) много ме е яд, че ги няма в базата. Май са на Макс Планк проби. Сарматите са тези: DA145.SG DA145 M RUS_Sarmatian DA144.SG DA144 M RUS_Sarmatian DA143.SG DA143 F RUS_Sarmatian DA141.SG DA141 M RUS_Sarmatian DA139.SG DA139 F RUS_Sarmatian DA136.SG DA136 M RUS_Sarmatian DA134.SG DA134 M RUS_Sarmatian I0575 I0575 M RUS_Sarmatian I0574 I0574 F RUS_Sarmatian Pr4.SG Pr4 M RUS_Sarmatian Pr10.SG Pr10 M RUS_Sarmatian chy001.SG chy001 F RUS_Sarmatian chy002.SG chy002 M RUS_Sarmatian tem002.SG tem002 M RUS_Sarmatian tem001.SG tem001 F RUS_Sarmatian tem003.SG tem003 M RUS_Sarmatian Според мен тези неща са излишни. Не сме от вчера и знаем какво е положението с критиката. Може да е неприятно и да създава някои проблеми, но без критика човек се отпуска и почва да пише глупости. Съдейки по глупостите, които изскачат от време на време, явно в българските археогенетични среди липсва нужната критика. Тъй че вместо да се оплакваш, трябва да черпиш
-
PCA от Г25: BGR_IA = Джулюница.
-
Строго погледнато, горната ф4 статистика не е достатъчна за такива изводи, понеже 1) може да има паразитен сигнал от КЛС и 2) зетките около Капитан Андреево не дават никаква надеждност. Затова се опитах да прецизирам ямненския компонент във византиеца с помощта на аутгруп ф3: Тези стойности са на база 80к снипа в ф2 блокове, защото иначе маймуната се инати. А се наложи да прибегна до нейна помощ, защото двамата негри дават различни резултати. В статистиката на Мбути византиецът се групира плътно с микенците, КА и българския халколит (там има Ямна, нищо че е халколит). В статистиката на Йоруба се групира с Джюлюница. Маймуната подкрепя този вариант - плътно с Джулюница. Извод: византиецът най-вероятно има Ямна колкото Джулюница или малко по-малко. Но все пак е само една проба, при това не особено качествена, тъй че нека бъдем предпазливи. А виж, колко Ямна има в Джюлюница - това е отделен въпрос
-
Всъщност Лазаридис е прав, просто моделът му е грешен. В българския византиец има много ясен ямненски сигнал, вероятно на капитанандреевско ниво: Изобщо, тази византийска проба се очертава крайно интересна...
-
Не. Общо са над 20к проби от 16к индивида. Това за голямата база, с модерните (v54.1.p1_HO_public). За останалото си прав. Аз по принцип съм отделил най-тлъстата проба от всеки индивид и само нея включвам в популацията, ама няма да ти казвам каква играчка е да се програмира тоя филтър върху мърлявата база на Райх. Изобщо, имам чувството, че тия в Харвард нямат айтита, ами някакви биолози пишат по файловете. Или пари не им се дават...
-
Сега за пълнотата на горните модели. Кавказките алани дават много устойчив източноазиатски сигнал, за разлика от салтовците: Хубави мазни зетки, които правят долния модел доста силен, с около 5-6% ИА: Салтово: Според мен тук работата е доста съмнителна, но и покритието е ниско. Да видим какво ще покажат другите салтовски проби от новите руски изследвания.
-
По този върос Г25 и qpAdm горе-долу са в съгласие един с друг: В тази популация влизат всички кавказки алани: и "ядрото" от предните ми постове, и аутлаерът, и един алан с ниско покритие, който липсва в Г25. Моделът е много добър и се подкрепя от другите статистики (което не означава, че е пълен). Само сърбите издишат, но те и така са си около процент, та не е фатално. Салтовците са рехави откъм статистическа значимост - и тримата са сниско покритие. Обединеният им представител в Г25 даже и след обединението е слабичък по стандартите на Давидски, но въпреки това сходството на двата модела (Г25 и qpAdm) дава основание да се приемат за читави:
-
Има общо 16 635 индивида. От тях 3 са в четири варианта, 224 са в три варианта, а 3439 са в два варианта. Ако нещо не съм объркал брояча. Скриптче: f_ind = "C:/AdmixTools/Dataset/v54.1.p1_HO_public_original.ind" t_ind = fread( f_ind, header = FALSE, col.names = c( 'ID', 'Sex', 'Population')) id_chunks = "\\.EC|\\.SG|\\.DG|\\.HO|_d|_noUDG|_all|_enhanced|_final_provisional|-ALL_DATA|_alt" t_ind$ID = str_replace_all( t_ind$ID, id_chunks, '') view( unique( t_ind[, `:=` (N = .N, Population = .SD[[1,2]]), by = ID])[order( -N)]) Ще извиняваш за дърварското изпълнение, ама не сме на конкурс за кодери
-
Ибаси змията. През ф2 работи. > result_f3 = f3 ("C:/AdmixTools/Dataset/v54.1.p1_HO_public", verbose = T, + "TUR_Marmara_Kumtepe_N", + "TUR_Marmara_Barcin_N", + c ("RUS_Yamnaya_Samara_EBA", + "ARM_Berkaber_KuraAraxes_EBA")) ℹ Computing from f3 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 593124 SNPs... ℹ Computing 2 f3-statistics for block 711 out of 711... ℹ Summarize across blocks... > result_f3[order(result_f3$z),] # A tibble: 2 × 8 pop1 pop2 pop3 est se z p n <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N RUS_Yamnaya_Samara_EBA NA NA NA NA NA 2 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N ARM_Berkaber_KuraAraxes_E… NA NA NA NA NA > result_f3 = f3 ("C:/AdmixTools/Dataset/v54.1.p1_1240K_public", verbose = T, + "TUR_Marmara_Kumtepe_N", + "TUR_Marmara_Barcin_N", + c ("RUS_Yamnaya_Samara_EBA", + "ARM_Berkaber_KuraAraxes_EBA")) ℹ Computing from f3 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 1150639 SNPs... ℹ Computing 2 f3-statistics for block 713 out of 713... ℹ Summarize across blocks... > result_f3[order(result_f3$z),] # A tibble: 2 × 8 pop1 pop2 pop3 est se z p n <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N RUS_Yamnaya_Samara_EBA NA NA NA NA NA 2 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N ARM_Berkaber_KuraAraxes_E… NA NA NA NA NA > count_snps(f2_blocks) [1] 28156 > result_f3 = f3 (f2_blocks, verbose = T, + "TUR_Marmara_Kumtepe_N", + "TUR_Marmara_Barcin_N", + c ("RUS_Yamnaya_Samara_EBA", + "ARM_Berkaber_KuraAraxes_EBA")) ℹ Computing f3-statistics > result_f3[order(result_f3$z),] # A tibble: 2 × 7 pop1 pop2 pop3 est se z p <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> 1 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N ARM_Berkaber_KuraAraxes_EBA 0.171 0.00163 105. 0 2 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N RUS_Yamnaya_Samara_EBA 0.172 0.00151 114. 0 >
-
Интересно. Това трябва да е през ф2-блоковете? Ще пробвам.
-
И двете бази ползвам, същата работа.
-
Покритието не е чак толкова ниско - 126к. В оригиналното изследване връткат всякакви статистики: Table S5: Key results obtained from D-statistics D(Outgroup, pop1; pop2, pop3). (Related to Figure 4A) https://ars.els-cdn.com/content/image/1-s2.0-S096098221501516X-mmc1.pdf И въпреки това базата на Райх нищо не дава: Иначе пробите от Кумтепе имат доста интересен геном, само че нещо са ги окастрили...
-
@tantin, би ли проверил как се държи при теб образецът "kum6_noUDG.SG", (популация "Turkey_Kumtepe_N.SG")?
-
Тц-тц, мърлява работа. Почна да ми пищи скрипта, отварям анотацията - някакви мешаници по средата на файла. I21276 в ексел. Тия хора са го писали на ръка и после изобщо не са го проверявали. Харвард, разбираш ли. Пфф...
-
Да, така го тълкувам. Тоест, в този случай на кпАдм не може да се има доверие. Макар че п-стойностите на Ряховец са добри, за разлика от българските. Но ф4 бие всичко, поне на този етап от статистическото ми познание > result_qpadm_Ryahovets$popdrop[1,] # A tibble: 1 × 16 pat wt dof chisq p f4rank CHG EHG Levant_PPN SRB_Iron_Gates_HG TUR_Marmara_Barcin_N feasible best dofdiff <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <lgl> <lgl> <dbl> 1 00000 0 5 8.40 0.135 4 0.307 0.200 0.0356 0.0994 0.357 TRUE NA NA # ℹ 2 more variables: chisqdiff <dbl>, p_nested <dbl> > result_qpadm_Bulgarian$popdrop[1,] # A tibble: 1 × 16 pat wt dof chisq p f4rank CHG EHG Levant_PPN SRB_Iron_Gates_HG TUR_Marmara_Barcin_N feasible best dofdiff <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <lgl> <lgl> <dbl> 1 00000 0 5 19.1 0.00185 4 0.278 0.150 0.0268 0.120 0.426 TRUE NA NA # ℹ 2 more variables: chisqdiff <dbl>, p_nested <dbl> >
-
Съвременните българи в тази схема (без DG, само HO): result_qpadm_Ryahovets = qpadm( + data = "C:/AdmixTools/Dataset/v54.1.p1_HO_public", + left = c( + "CHG", + "EHG", + "Levant_PPN", + "SRB_Iron_Gates_HG", + "TUR_Marmara_Barcin_N" + ), + right = c( + "Mbuti.DG", + "IRN_Ganj_Dareh_N", + "ISR_Natufian_EpiP", + "MAR_Taforalt_EpiP", + "Mesopotamia", + "RUS_AfontovaGora3", + "RUS_MA1_HG", + "TUR_C_Boncuklu_PPN", + "TUR_Pinarbasi_EpiP", + "WHG" + ), + target = "Bulgarian.HO", + allsnps = T + ) ℹ Reading metadata... ℹ Computing block lengths for 593124 SNPs... ℹ Computing 45 f4-statistics for block 711 out of 711... ℹ "allsnps = TRUE" uses different SNPs for each f4-statistic Number of SNPs used for each f4-statistic: pop1 pop2 pop3 pop4 n 1 Bulgarian.HO CHG Mbuti.DG IRN_Ganj_Dareh_N 553696 2 Bulgarian.HO CHG Mbuti.DG ISR_Natufian_EpiP 283702 3 Bulgarian.HO CHG Mbuti.DG MAR_Taforalt_EpiP 568148 4 Bulgarian.HO CHG Mbuti.DG Mesopotamia 453740 5 Bulgarian.HO CHG Mbuti.DG RUS_AfontovaGora3 161230 6 Bulgarian.HO CHG Mbuti.DG RUS_MA1_HG 420191 7 Bulgarian.HO CHG Mbuti.DG TUR_C_Boncuklu_PPN 555185 8 Bulgarian.HO CHG Mbuti.DG TUR_Pinarbasi_EpiP 449535 9 Bulgarian.HO CHG Mbuti.DG WHG 584521 10 Bulgarian.HO EHG Mbuti.DG IRN_Ganj_Dareh_N 549660 11 Bulgarian.HO EHG Mbuti.DG ISR_Natufian_EpiP 282184 12 Bulgarian.HO EHG Mbuti.DG MAR_Taforalt_EpiP 563758 13 Bulgarian.HO EHG Mbuti.DG Mesopotamia 450916 14 Bulgarian.HO EHG Mbuti.DG RUS_AfontovaGora3 160712 15 Bulgarian.HO EHG Mbuti.DG RUS_MA1_HG 416320 16 Bulgarian.HO EHG Mbuti.DG TUR_C_Boncuklu_PPN 550777 17 Bulgarian.HO EHG Mbuti.DG TUR_Pinarbasi_EpiP 446604 18 Bulgarian.HO EHG Mbuti.DG WHG 578703 19 Bulgarian.HO Levant_PPN Mbuti.DG IRN_Ganj_Dareh_N 432847 20 Bulgarian.HO Levant_PPN Mbuti.DG ISR_Natufian_EpiP 248859 21 Bulgarian.HO Levant_PPN Mbuti.DG MAR_Taforalt_EpiP 434644 22 Bulgarian.HO Levant_PPN Mbuti.DG Mesopotamia 374734 23 Bulgarian.HO Levant_PPN Mbuti.DG RUS_AfontovaGora3 140991 24 Bulgarian.HO Levant_PPN Mbuti.DG RUS_MA1_HG 320639 25 Bulgarian.HO Levant_PPN Mbuti.DG TUR_C_Boncuklu_PPN 427232 26 Bulgarian.HO Levant_PPN Mbuti.DG TUR_Pinarbasi_EpiP 363077 27 Bulgarian.HO Levant_PPN Mbuti.DG WHG 439042 28 Bulgarian.HO SRB_Iron_Gates_HG Mbuti.DG IRN_Ganj_Dareh_N 553867 29 Bulgarian.HO SRB_Iron_Gates_HG Mbuti.DG ISR_Natufian_EpiP 283864 30 Bulgarian.HO SRB_Iron_Gates_HG Mbuti.DG MAR_Taforalt_EpiP 567946 31 Bulgarian.HO SRB_Iron_Gates_HG Mbuti.DG Mesopotamia 453937 32 Bulgarian.HO SRB_Iron_Gates_HG Mbuti.DG RUS_AfontovaGora3 161338 33 Bulgarian.HO SRB_Iron_Gates_HG Mbuti.DG RUS_MA1_HG 419583 34 Bulgarian.HO SRB_Iron_Gates_HG Mbuti.DG TUR_C_Boncuklu_PPN 554983 35 Bulgarian.HO SRB_Iron_Gates_HG Mbuti.DG TUR_Pinarbasi_EpiP 449633 36 Bulgarian.HO SRB_Iron_Gates_HG Mbuti.DG WHG 583556 37 Bulgarian.HO TUR_Marmara_Barcin_N Mbuti.DG IRN_Ganj_Dareh_N 554233 38 Bulgarian.HO TUR_Marmara_Barcin_N Mbuti.DG ISR_Natufian_EpiP 283906 39 Bulgarian.HO TUR_Marmara_Barcin_N Mbuti.DG MAR_Taforalt_EpiP 568728 40 Bulgarian.HO TUR_Marmara_Barcin_N Mbuti.DG Mesopotamia 454131 41 Bulgarian.HO TUR_Marmara_Barcin_N Mbuti.DG RUS_AfontovaGora3 161369 42 Bulgarian.HO TUR_Marmara_Barcin_N Mbuti.DG RUS_MA1_HG 420575 43 Bulgarian.HO TUR_Marmara_Barcin_N Mbuti.DG TUR_C_Boncuklu_PPN 555730 44 Bulgarian.HO TUR_Marmara_Barcin_N Mbuti.DG TUR_Pinarbasi_EpiP 449932 45 Bulgarian.HO TUR_Marmara_Barcin_N Mbuti.DG WHG 585160 ℹ Computing admixture weights... ℹ Computing standard errors... ℹ Computing number of admixture waves... warning: solve(): system is singular (rcond: 2.48874e-17); attempting approx solution warning: solve(): system is singular (rcond: 7.78132e-18); attempting approx solution warning: solve(): system is singular (rcond: 8.62477e-19); attempting approx solution > result_qpadm_Ryahovets$weights # A tibble: 5 × 5 target left weight se z <chr> <chr> <dbl> <dbl> <dbl> 1 Bulgarian.HO CHG 0.278 0.0158 17.6 2 Bulgarian.HO EHG 0.150 0.0145 10.4 3 Bulgarian.HO Levant_PPN 0.0268 0.0209 1.28 4 Bulgarian.HO SRB_Iron_Gates_HG 0.120 0.0106 11.3 5 Bulgarian.HO TUR_Marmara_Barcin_N 0.426 0.0225 18.9 > ф4: f4( + "C:/AdmixTools/Dataset/v54.1.p1_HO_public", + "Bulgarian.HO", + "Mbuti.DG", + "EHG", + "CHG" + ) ℹ Getting population combinations... ℹ 1 population combinations found ℹ Computing from f4 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 593124 SNPs... ℹ Computing 1 f4-statistics for block 711 out of 711... ℹ Summarize across blocks... # A tibble: 1 × 9 pop1 pop2 pop3 pop4 est se z p n <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 Bulgarian.HO Mbuti.DG EHG CHG 0.00176 0.000340 5.17 0.000000229 578104 >
