
Кухулин
Потребител-
Брой отговори
4761 -
Регистрация
-
Последен вход
-
Days Won
15
Content Type
Профили
Форуми
Библиотека
Articles
Блогове
ВСИЧКО ПУБЛИКУВАНО ОТ Кухулин
-
Мерси, ще ги проуча. Въпросът е сложен. Днес почти всички сериозни изследвания са по всички снипове. Теоретично има недостатъци, но на практика позволява широко използване на десни популации, което дава пълнота и надеждност на моделите. Иначе трябва да моделираш върху 50-60к снипа в най-добрия случай, което не е красиво. На мен ротационните модели ми падат до 4-5к снипа, затова не ги използвам. И Лазаридис затова не ги използва
-
Е, хм, не знам. Трудно ще минем без славяни - сигналите са налице. Колкото до прабългарите, там не може да се каже нищо без още проби. Най-подходящите образци за ИА компонент според Г25 са на Макс Планк, съответно липсват при Райх. Става дума за RUS_Late_Xiongnu_Sarmatian. Но принципно може да се мине и без ИА, в аланите например си го има достатъчно. Иначе някакъв двукомпонентен модел може да се сметне, но с много нули след запетайката: > result_qp = qpadm ('C:/AdmixTools/Dataset/v54.1.p1_HO_public', verbose = T, + left = c ('BGR_KapitanAndreevo_IA', + 'UKR_Scythian'), + right = c ('Mbuti.DG', + 'CHG', + 'EHG', + 'Levant_PPN', + 'SRB_Iron_Gates_HG', + 'TUR_Marmara_Barcin_N', + 'IRN_Ganj_Dareh_N', + 'ISR_Natufian_EpiP', + 'MAR_Taforalt_EpiP', + 'RUS_AfontovaGora3', + 'Mesopotamia', + 'RUS_MA1_HG', + 'TUR_C_Boncuklu_PPN', + 'TUR_Pinarbasi_EpiP', + 'RUS_DevilsCave_N', + 'WHG'), + target = 'Bulgarian.HO', + allsnps = T) ℹ Reading metadata... ℹ Computing block lengths for 593124 SNPs... ℹ Computing 30 f4-statistics for block 711 out of 711... ℹ "allsnps = TRUE" uses different SNPs for each f4-statistic Number of SNPs used for each f4-statistic: pop1 pop2 pop3 pop4 n 1 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG CHG 566383 2 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG EHG 542723 3 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG IRN_Ganj_Dareh_N 546955 4 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG ISR_Natufian_EpiP 88834 5 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG Levant_PPN 439208 6 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG MAR_Taforalt_EpiP 555520 7 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG Mesopotamia 451475 8 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG RUS_AfontovaGora3 161936 9 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG RUS_DevilsCave_N 566432 10 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG RUS_MA1_HG 409077 11 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG SRB_Iron_Gates_HG 566343 12 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG TUR_C_Boncuklu_PPN 543477 13 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG TUR_Marmara_Barcin_N 566693 14 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG TUR_Pinarbasi_EpiP 445375 15 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG WHG 566982 16 Bulgarian.HO UKR_Scythian Mbuti.DG CHG 485205 17 Bulgarian.HO UKR_Scythian Mbuti.DG EHG 460914 18 Bulgarian.HO UKR_Scythian Mbuti.DG IRN_Ganj_Dareh_N 461538 19 Bulgarian.HO UKR_Scythian Mbuti.DG ISR_Natufian_EpiP 74370 20 Bulgarian.HO UKR_Scythian Mbuti.DG Levant_PPN 366585 21 Bulgarian.HO UKR_Scythian Mbuti.DG MAR_Taforalt_EpiP 472384 22 Bulgarian.HO UKR_Scythian Mbuti.DG Mesopotamia 378927 23 Bulgarian.HO UKR_Scythian Mbuti.DG RUS_AfontovaGora3 135381 24 Bulgarian.HO UKR_Scythian Mbuti.DG RUS_DevilsCave_N 485264 25 Bulgarian.HO UKR_Scythian Mbuti.DG RUS_MA1_HG 349642 26 Bulgarian.HO UKR_Scythian Mbuti.DG SRB_Iron_Gates_HG 484345 27 Bulgarian.HO UKR_Scythian Mbuti.DG TUR_C_Boncuklu_PPN 461749 28 Bulgarian.HO UKR_Scythian Mbuti.DG TUR_Marmara_Barcin_N 485123 29 Bulgarian.HO UKR_Scythian Mbuti.DG TUR_Pinarbasi_EpiP 374920 30 Bulgarian.HO UKR_Scythian Mbuti.DG WHG 485659 ℹ Computing admixture weights... ℹ Computing standard errors... ℹ Computing number of admixture waves... > result_qp$weights # A tibble: 2 × 5 target left weight se z <chr> <chr> <dbl> <dbl> <dbl> 1 Bulgarian.HO BGR_KapitanAndreevo_IA 0.371 0.0332 11.2 2 Bulgarian.HO UKR_Scythian 0.629 0.0332 19.0 > result_qp$popdrop[1,] # A tibble: 1 × 13 pat wt dof chisq p f4rank BGR_KapitanAndreevo_IA UKR_Scythian feasible best <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <lgl> <lgl> 1 00 0 14 66.9 7.11e-9 1 0.371 0.629 TRUE NA # ℹ 3 more variables: dofdiff <dbl>, chisqdiff <dbl>, p_nested <dbl> >
-
Сега погледнах пак началото на темата. Не мога много ясно да разбера каква е тезата, но връзката на съвременните българи с Капитан Андреево и със сарматите се доказва достатъчно просто: > result_f3 = f3 ("C:/AdmixTools/Dataset/v54.1.p1_HO_public", verbose = T, + "Bulgarian.HO", + "BGR_KapitanAndreevo_IA", + "RUS_Sarmatian") ℹ Computing from f3 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 593124 SNPs... ℹ Computing 1 f3-statistics for block 711 out of 711... ℹ Summarize across blocks... > result_f3 # A tibble: 1 × 8 pop1 pop2 pop3 est se z p n <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 Bulgarian.HO BGR_KapitanAndreevo_IA RUS_Sarmatian -0.00247 0.000442 -5.60 0.0000000220 562811 > Друг е въпросът, че КА не е директен компонент, дори само по хронологични причини. Връзката явно минава през по-късни популации, според мен близки до BGR_Anc и BGR_RomByz.
-
Тъкмо днес гледах някакви статистически примери с неандерталци от пещерата Виндия и хоп - Дробишевски пак избухна 24:45
-
При по-сериозна проверка аутгруп-ф3 статистиката показа, че хърватското и джулюнишкото желязо имат по-висок месопотамски компонент от Розово. Тоест аргумент номер 3 е невалиден. Пълен код: > result_f3 = f3 ("C:/AdmixTools/Dataset/v54.1.p1_1240K_public", verbose = T, + c ("Mbuti.DG"), + c ("Mesopotamia"), + c ("SRB_Iron_Gates_HG", + "BGR_Dzhulyunitsa_IA", + "HRV_IA", + "BGR_Anc", + "GBR_England_Bell_Beaker")) ℹ Computing from f3 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 1150639 SNPs... ℹ Computing 5 f3-statistics for block 713 out of 713... ℹ Summarize across blocks... > result_f3[order(result_f3$est),] # A tibble: 5 × 8 pop1 pop2 pop3 est se z p n <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 Mbuti.DG Mesopotamia SRB_Iron_Gates_HG 0.269 0.00227 119. 0 861146 2 Mbuti.DG Mesopotamia GBR_England_Bell_Beaker 0.276 0.00220 126. 0 857898 3 Mbuti.DG Mesopotamia BGR_Anc 0.279 0.00291 95.7 0 346647 4 Mbuti.DG Mesopotamia HRV_IA 0.279 0.00230 122. 0 785255 5 Mbuti.DG Mesopotamia BGR_Dzhulyunitsa_IA 0.283 0.00273 104. 0 605558 > Аргумент номер 2 също не е валиден, тъй като 5-компонентният модел не е възпроизводим. И в ф4 статистиките липсва завишен дисбаланс КЛС-ИЕЛС. С други думи на този етап няма обективни причини да разглеждаме Розово отделно от местното желязо.
-
Според мен на този етап е рано да се правят някакви генерални изводи за ролята на кавказките алани в българския микс. Много голяма част от досегашните анализи се основаваха върху работите на Дамгаар и Лазаридис - съответно високия КЛС-компонент в аланите и 5-компонентния модел на българите. При по-сериозна проверка нищо от това не се потвърждава. Нито кавказките алани на Дамгаар са с висок КЛС, нито нашият 5-компонентен модел може да се възпроизведе що-годе надеждно. Следователно трябва да разчитаме изцяло на собствените си сили, които за съжаление не са в някаква пикова фаза Какво показват лично за мен скромните ми занимавки с адмикстулса? Показват, че цялата стабилност на моделите се крепи върху славяните и местния дославянски компонент. Там са високите проценти, там е солидната статистическа значимост - устойчиво над 3 сигма. Останалите компоненти са гола вода - алани, сармати, хунну, мунну - всичко е под 3 и играе в процентите, както си иска. А най-лошото е, че тези плаващи алано-хунски компоненти са представени от многобройни и качествени проби. И въпреки това не могат да генерират статистическа значимост. А славяните и особено нашенците са еднични проби на някакъв остатъчен принцип - тоя оттук, оня оттам, понякога с мизерни снипове. И дават 4-5-7 зет. Чак срам да го хване човек. Извод: всяка нова българска проба от дославянския период може коренно да измени картината. Трябва да се формира ясна антична популация, за да видим кой е ядро, кой е аутлаер и т. н. Тогава вече ще можем да смятаме моделите на по-стабилна основа. А след това да ги сравняваме с пробите от прабългарските погребения и да си чешем езиците Е те тогава ще се излеят мазните потоци "интернет-критика" от всякакъв вид форумни анализатори. Това днешното нищо не е. Аз ако съм на Южняка, ще си взема отпуска
-
Не, не съм го ползвал. Има ли някаква реална полза от него?
-
Още един, този път с Розово. И покрай тази проба се очертава интересна ситуация, но още не съм я гледал под лупа като византиеца.
-
За теб винаги. Горе-долу читав модел с кавказките алани от таблицата в другия форум: Както писах и там, с византиеца всичко се получава много гладко. Не знам обаче какво ще е положението, като излязат новите руски изследвания. Предварителните данни, които постна genefan, показват доста голяма разлика между "нашите" кавказки алани и техните. Пълен код на модела:
-
Е така е, ама ако не става иначе... Като се разминат сниповете, няма начин. Шимпанзето много го обича тоя номер. Българските проби също са капризни. Освен това има и друг момент - много хора са твърдо против алснипс в адмикса, защото изкривява ф4. Обаче е по-лесно. Лазаридис например го ползва. Аз засега нямам мнение. Аварските славяни адмиксът си ги хареса, аз бях пъхнал няколко вида. Пък и славяни като славяни, какво им е? Виж, за Кракауер Берг (KRA001 и другите) много ме е яд, че ги няма в базата. Май са на Макс Планк проби. Сарматите са тези: DA145.SG DA145 M RUS_Sarmatian DA144.SG DA144 M RUS_Sarmatian DA143.SG DA143 F RUS_Sarmatian DA141.SG DA141 M RUS_Sarmatian DA139.SG DA139 F RUS_Sarmatian DA136.SG DA136 M RUS_Sarmatian DA134.SG DA134 M RUS_Sarmatian I0575 I0575 M RUS_Sarmatian I0574 I0574 F RUS_Sarmatian Pr4.SG Pr4 M RUS_Sarmatian Pr10.SG Pr10 M RUS_Sarmatian chy001.SG chy001 F RUS_Sarmatian chy002.SG chy002 M RUS_Sarmatian tem002.SG tem002 M RUS_Sarmatian tem001.SG tem001 F RUS_Sarmatian tem003.SG tem003 M RUS_Sarmatian Според мен тези неща са излишни. Не сме от вчера и знаем какво е положението с критиката. Може да е неприятно и да създава някои проблеми, но без критика човек се отпуска и почва да пише глупости. Съдейки по глупостите, които изскачат от време на време, явно в българските археогенетични среди липсва нужната критика. Тъй че вместо да се оплакваш, трябва да черпиш
-
PCA от Г25: BGR_IA = Джулюница.
-
Строго погледнато, горната ф4 статистика не е достатъчна за такива изводи, понеже 1) може да има паразитен сигнал от КЛС и 2) зетките около Капитан Андреево не дават никаква надеждност. Затова се опитах да прецизирам ямненския компонент във византиеца с помощта на аутгруп ф3: Тези стойности са на база 80к снипа в ф2 блокове, защото иначе маймуната се инати. А се наложи да прибегна до нейна помощ, защото двамата негри дават различни резултати. В статистиката на Мбути византиецът се групира плътно с микенците, КА и българския халколит (там има Ямна, нищо че е халколит). В статистиката на Йоруба се групира с Джюлюница. Маймуната подкрепя този вариант - плътно с Джулюница. Извод: византиецът най-вероятно има Ямна колкото Джулюница или малко по-малко. Но все пак е само една проба, при това не особено качествена, тъй че нека бъдем предпазливи. А виж, колко Ямна има в Джюлюница - това е отделен въпрос
-
Всъщност Лазаридис е прав, просто моделът му е грешен. В българския византиец има много ясен ямненски сигнал, вероятно на капитанандреевско ниво: Изобщо, тази византийска проба се очертава крайно интересна...
-
Не. Общо са над 20к проби от 16к индивида. Това за голямата база, с модерните (v54.1.p1_HO_public). За останалото си прав. Аз по принцип съм отделил най-тлъстата проба от всеки индивид и само нея включвам в популацията, ама няма да ти казвам каква играчка е да се програмира тоя филтър върху мърлявата база на Райх. Изобщо, имам чувството, че тия в Харвард нямат айтита, ами някакви биолози пишат по файловете. Или пари не им се дават...
-
Сега за пълнотата на горните модели. Кавказките алани дават много устойчив източноазиатски сигнал, за разлика от салтовците: Хубави мазни зетки, които правят долния модел доста силен, с около 5-6% ИА: Салтово: Според мен тук работата е доста съмнителна, но и покритието е ниско. Да видим какво ще покажат другите салтовски проби от новите руски изследвания.
-
По този върос Г25 и qpAdm горе-долу са в съгласие един с друг: В тази популация влизат всички кавказки алани: и "ядрото" от предните ми постове, и аутлаерът, и един алан с ниско покритие, който липсва в Г25. Моделът е много добър и се подкрепя от другите статистики (което не означава, че е пълен). Само сърбите издишат, но те и така са си около процент, та не е фатално. Салтовците са рехави откъм статистическа значимост - и тримата са сниско покритие. Обединеният им представител в Г25 даже и след обединението е слабичък по стандартите на Давидски, но въпреки това сходството на двата модела (Г25 и qpAdm) дава основание да се приемат за читави:
-
Има общо 16 635 индивида. От тях 3 са в четири варианта, 224 са в три варианта, а 3439 са в два варианта. Ако нещо не съм объркал брояча. Скриптче: f_ind = "C:/AdmixTools/Dataset/v54.1.p1_HO_public_original.ind" t_ind = fread( f_ind, header = FALSE, col.names = c( 'ID', 'Sex', 'Population')) id_chunks = "\\.EC|\\.SG|\\.DG|\\.HO|_d|_noUDG|_all|_enhanced|_final_provisional|-ALL_DATA|_alt" t_ind$ID = str_replace_all( t_ind$ID, id_chunks, '') view( unique( t_ind[, `:=` (N = .N, Population = .SD[[1,2]]), by = ID])[order( -N)]) Ще извиняваш за дърварското изпълнение, ама не сме на конкурс за кодери
-
Ибаси змията. През ф2 работи. > result_f3 = f3 ("C:/AdmixTools/Dataset/v54.1.p1_HO_public", verbose = T, + "TUR_Marmara_Kumtepe_N", + "TUR_Marmara_Barcin_N", + c ("RUS_Yamnaya_Samara_EBA", + "ARM_Berkaber_KuraAraxes_EBA")) ℹ Computing from f3 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 593124 SNPs... ℹ Computing 2 f3-statistics for block 711 out of 711... ℹ Summarize across blocks... > result_f3[order(result_f3$z),] # A tibble: 2 × 8 pop1 pop2 pop3 est se z p n <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N RUS_Yamnaya_Samara_EBA NA NA NA NA NA 2 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N ARM_Berkaber_KuraAraxes_E… NA NA NA NA NA > result_f3 = f3 ("C:/AdmixTools/Dataset/v54.1.p1_1240K_public", verbose = T, + "TUR_Marmara_Kumtepe_N", + "TUR_Marmara_Barcin_N", + c ("RUS_Yamnaya_Samara_EBA", + "ARM_Berkaber_KuraAraxes_EBA")) ℹ Computing from f3 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 1150639 SNPs... ℹ Computing 2 f3-statistics for block 713 out of 713... ℹ Summarize across blocks... > result_f3[order(result_f3$z),] # A tibble: 2 × 8 pop1 pop2 pop3 est se z p n <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N RUS_Yamnaya_Samara_EBA NA NA NA NA NA 2 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N ARM_Berkaber_KuraAraxes_E… NA NA NA NA NA > count_snps(f2_blocks) [1] 28156 > result_f3 = f3 (f2_blocks, verbose = T, + "TUR_Marmara_Kumtepe_N", + "TUR_Marmara_Barcin_N", + c ("RUS_Yamnaya_Samara_EBA", + "ARM_Berkaber_KuraAraxes_EBA")) ℹ Computing f3-statistics > result_f3[order(result_f3$z),] # A tibble: 2 × 7 pop1 pop2 pop3 est se z p <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> 1 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N ARM_Berkaber_KuraAraxes_EBA 0.171 0.00163 105. 0 2 TUR_Marmara_Kumtepe_N TUR_Marmara_Barcin_N RUS_Yamnaya_Samara_EBA 0.172 0.00151 114. 0 >
-
Интересно. Това трябва да е през ф2-блоковете? Ще пробвам.