Забелязахме, че използвате Ad Blocker

Разбираме желанието ви за по-добро потребителско изживяване, но рекламите помагат за поддържането на форума.

Имате два варианта:
1. Регистрирайте се безплатно и разглеждайте форума без реклами
2. Изключете Ad Blocker-а за този сайт:
    • Кликнете върху иконата на Ad Blocker в браузъра
    • Изберете "Pause" или "Disable" за този сайт

Регистрирайте се или обновете страницата след изключване на Ad Blocker

Отиди на
Форум "Наука"

Кухулин

Потребител
  • Брой отговори

    4763
  • Регистрация

  • Последен вход

  • Days Won

    15

ВСИЧКО ПУБЛИКУВАНО ОТ Кухулин

  1. Няма страшно. Тематиката ми е интересна, пък и чакането на нови данни добавя към тръпката Относно Самоводене, аз се отнасям доста предпазливо към конкретните миксове по негов адрес. Реших да подходя от друг ъгъл и имам някои предварителни резултати, плод на не много проста статистическа обработка. Донякъде се потвърждават впечатленията на Атом от другата тема. Това е на база аутгруп ф3 и линейна корелация. Вижда се дефицит на КЛС, т. е. балансът е изместен в полза на ИЕЛС.
  2. Всичко е на руски при него. Но конкретно този въпрос не го е обсъждал.
  3. Мерси, ще ги проуча. Въпросът е сложен. Днес почти всички сериозни изследвания са по всички снипове. Теоретично има недостатъци, но на практика позволява широко използване на десни популации, което дава пълнота и надеждност на моделите. Иначе трябва да моделираш върху 50-60к снипа в най-добрия случай, което не е красиво. На мен ротационните модели ми падат до 4-5к снипа, затова не ги използвам. И Лазаридис затова не ги използва
  4. Би ли дал кодовете на тези проби. Предполагам за кои говориш, но все пак. И тези сходни резултати, ако не те затруднява. При мен с КА се получават доста специфични модели.
  5. Е, хм, не знам. Трудно ще минем без славяни - сигналите са налице. Колкото до прабългарите, там не може да се каже нищо без още проби. Най-подходящите образци за ИА компонент според Г25 са на Макс Планк, съответно липсват при Райх. Става дума за RUS_Late_Xiongnu_Sarmatian. Но принципно може да се мине и без ИА, в аланите например си го има достатъчно. Иначе някакъв двукомпонентен модел може да се сметне, но с много нули след запетайката: > result_qp = qpadm ('C:/AdmixTools/Dataset/v54.1.p1_HO_public', verbose = T, + left = c ('BGR_KapitanAndreevo_IA', + 'UKR_Scythian'), + right = c ('Mbuti.DG', + 'CHG', + 'EHG', + 'Levant_PPN', + 'SRB_Iron_Gates_HG', + 'TUR_Marmara_Barcin_N', + 'IRN_Ganj_Dareh_N', + 'ISR_Natufian_EpiP', + 'MAR_Taforalt_EpiP', + 'RUS_AfontovaGora3', + 'Mesopotamia', + 'RUS_MA1_HG', + 'TUR_C_Boncuklu_PPN', + 'TUR_Pinarbasi_EpiP', + 'RUS_DevilsCave_N', + 'WHG'), + target = 'Bulgarian.HO', + allsnps = T) ℹ Reading metadata... ℹ Computing block lengths for 593124 SNPs... ℹ Computing 30 f4-statistics for block 711 out of 711... ℹ "allsnps = TRUE" uses different SNPs for each f4-statistic Number of SNPs used for each f4-statistic: pop1 pop2 pop3 pop4 n 1 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG CHG 566383 2 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG EHG 542723 3 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG IRN_Ganj_Dareh_N 546955 4 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG ISR_Natufian_EpiP 88834 5 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG Levant_PPN 439208 6 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG MAR_Taforalt_EpiP 555520 7 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG Mesopotamia 451475 8 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG RUS_AfontovaGora3 161936 9 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG RUS_DevilsCave_N 566432 10 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG RUS_MA1_HG 409077 11 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG SRB_Iron_Gates_HG 566343 12 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG TUR_C_Boncuklu_PPN 543477 13 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG TUR_Marmara_Barcin_N 566693 14 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG TUR_Pinarbasi_EpiP 445375 15 Bulgarian.HO BGR_KapitanAndreevo_IA Mbuti.DG WHG 566982 16 Bulgarian.HO UKR_Scythian Mbuti.DG CHG 485205 17 Bulgarian.HO UKR_Scythian Mbuti.DG EHG 460914 18 Bulgarian.HO UKR_Scythian Mbuti.DG IRN_Ganj_Dareh_N 461538 19 Bulgarian.HO UKR_Scythian Mbuti.DG ISR_Natufian_EpiP 74370 20 Bulgarian.HO UKR_Scythian Mbuti.DG Levant_PPN 366585 21 Bulgarian.HO UKR_Scythian Mbuti.DG MAR_Taforalt_EpiP 472384 22 Bulgarian.HO UKR_Scythian Mbuti.DG Mesopotamia 378927 23 Bulgarian.HO UKR_Scythian Mbuti.DG RUS_AfontovaGora3 135381 24 Bulgarian.HO UKR_Scythian Mbuti.DG RUS_DevilsCave_N 485264 25 Bulgarian.HO UKR_Scythian Mbuti.DG RUS_MA1_HG 349642 26 Bulgarian.HO UKR_Scythian Mbuti.DG SRB_Iron_Gates_HG 484345 27 Bulgarian.HO UKR_Scythian Mbuti.DG TUR_C_Boncuklu_PPN 461749 28 Bulgarian.HO UKR_Scythian Mbuti.DG TUR_Marmara_Barcin_N 485123 29 Bulgarian.HO UKR_Scythian Mbuti.DG TUR_Pinarbasi_EpiP 374920 30 Bulgarian.HO UKR_Scythian Mbuti.DG WHG 485659 ℹ Computing admixture weights... ℹ Computing standard errors... ℹ Computing number of admixture waves... > result_qp$weights # A tibble: 2 × 5 target left weight se z <chr> <chr> <dbl> <dbl> <dbl> 1 Bulgarian.HO BGR_KapitanAndreevo_IA 0.371 0.0332 11.2 2 Bulgarian.HO UKR_Scythian 0.629 0.0332 19.0 > result_qp$popdrop[1,] # A tibble: 1 × 13 pat wt dof chisq p f4rank BGR_KapitanAndreevo_IA UKR_Scythian feasible best <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <lgl> <lgl> 1 00 0 14 66.9 7.11e-9 1 0.371 0.629 TRUE NA # ℹ 3 more variables: dofdiff <dbl>, chisqdiff <dbl>, p_nested <dbl> >
  6. Сега погледнах пак началото на темата. Не мога много ясно да разбера каква е тезата, но връзката на съвременните българи с Капитан Андреево и със сарматите се доказва достатъчно просто: > result_f3 = f3 ("C:/AdmixTools/Dataset/v54.1.p1_HO_public", verbose = T, + "Bulgarian.HO", + "BGR_KapitanAndreevo_IA", + "RUS_Sarmatian") ℹ Computing from f3 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 593124 SNPs... ℹ Computing 1 f3-statistics for block 711 out of 711... ℹ Summarize across blocks... > result_f3 # A tibble: 1 × 8 pop1 pop2 pop3 est se z p n <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 Bulgarian.HO BGR_KapitanAndreevo_IA RUS_Sarmatian -0.00247 0.000442 -5.60 0.0000000220 562811 > Друг е въпросът, че КА не е директен компонент, дори само по хронологични причини. Връзката явно минава през по-късни популации, според мен близки до BGR_Anc и BGR_RomByz.
  7. Тъкмо днес гледах някакви статистически примери с неандерталци от пещерата Виндия и хоп - Дробишевски пак избухна 24:45
  8. При по-сериозна проверка аутгруп-ф3 статистиката показа, че хърватското и джулюнишкото желязо имат по-висок месопотамски компонент от Розово. Тоест аргумент номер 3 е невалиден. Пълен код: > result_f3 = f3 ("C:/AdmixTools/Dataset/v54.1.p1_1240K_public", verbose = T, + c ("Mbuti.DG"), + c ("Mesopotamia"), + c ("SRB_Iron_Gates_HG", + "BGR_Dzhulyunitsa_IA", + "HRV_IA", + "BGR_Anc", + "GBR_England_Bell_Beaker")) ℹ Computing from f3 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 1150639 SNPs... ℹ Computing 5 f3-statistics for block 713 out of 713... ℹ Summarize across blocks... > result_f3[order(result_f3$est),] # A tibble: 5 × 8 pop1 pop2 pop3 est se z p n <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 Mbuti.DG Mesopotamia SRB_Iron_Gates_HG 0.269 0.00227 119. 0 861146 2 Mbuti.DG Mesopotamia GBR_England_Bell_Beaker 0.276 0.00220 126. 0 857898 3 Mbuti.DG Mesopotamia BGR_Anc 0.279 0.00291 95.7 0 346647 4 Mbuti.DG Mesopotamia HRV_IA 0.279 0.00230 122. 0 785255 5 Mbuti.DG Mesopotamia BGR_Dzhulyunitsa_IA 0.283 0.00273 104. 0 605558 > Аргумент номер 2 също не е валиден, тъй като 5-компонентният модел не е възпроизводим. И в ф4 статистиките липсва завишен дисбаланс КЛС-ИЕЛС. С други думи на този етап няма обективни причини да разглеждаме Розово отделно от местното желязо.
  9. Според мен на този етап е рано да се правят някакви генерални изводи за ролята на кавказките алани в българския микс. Много голяма част от досегашните анализи се основаваха върху работите на Дамгаар и Лазаридис - съответно високия КЛС-компонент в аланите и 5-компонентния модел на българите. При по-сериозна проверка нищо от това не се потвърждава. Нито кавказките алани на Дамгаар са с висок КЛС, нито нашият 5-компонентен модел може да се възпроизведе що-годе надеждно. Следователно трябва да разчитаме изцяло на собствените си сили, които за съжаление не са в някаква пикова фаза Какво показват лично за мен скромните ми занимавки с адмикстулса? Показват, че цялата стабилност на моделите се крепи върху славяните и местния дославянски компонент. Там са високите проценти, там е солидната статистическа значимост - устойчиво над 3 сигма. Останалите компоненти са гола вода - алани, сармати, хунну, мунну - всичко е под 3 и играе в процентите, както си иска. А най-лошото е, че тези плаващи алано-хунски компоненти са представени от многобройни и качествени проби. И въпреки това не могат да генерират статистическа значимост. А славяните и особено нашенците са еднични проби на някакъв остатъчен принцип - тоя оттук, оня оттам, понякога с мизерни снипове. И дават 4-5-7 зет. Чак срам да го хване човек. Извод: всяка нова българска проба от дославянския период може коренно да измени картината. Трябва да се формира ясна антична популация, за да видим кой е ядро, кой е аутлаер и т. н. Тогава вече ще можем да смятаме моделите на по-стабилна основа. А след това да ги сравняваме с пробите от прабългарските погребения и да си чешем езиците Е те тогава ще се излеят мазните потоци "интернет-критика" от всякакъв вид форумни анализатори. Това днешното нищо не е. Аз ако съм на Южняка, ще си взема отпуска
  10. Не, не съм го ползвал. Има ли някаква реална полза от него?
  11. Още един, този път с Розово. И покрай тази проба се очертава интересна ситуация, но още не съм я гледал под лупа като византиеца.
  12. За теб винаги. Горе-долу читав модел с кавказките алани от таблицата в другия форум: Както писах и там, с византиеца всичко се получава много гладко. Не знам обаче какво ще е положението, като излязат новите руски изследвания. Предварителните данни, които постна genefan, показват доста голяма разлика между "нашите" кавказки алани и техните. Пълен код на модела:
  13. Е така е, ама ако не става иначе... Като се разминат сниповете, няма начин. Шимпанзето много го обича тоя номер. Българските проби също са капризни. Освен това има и друг момент - много хора са твърдо против алснипс в адмикса, защото изкривява ф4. Обаче е по-лесно. Лазаридис например го ползва. Аз засега нямам мнение. Аварските славяни адмиксът си ги хареса, аз бях пъхнал няколко вида. Пък и славяни като славяни, какво им е? Виж, за Кракауер Берг (KRA001 и другите) много ме е яд, че ги няма в базата. Май са на Макс Планк проби. Сарматите са тези: DA145.SG DA145 M RUS_Sarmatian DA144.SG DA144 M RUS_Sarmatian DA143.SG DA143 F RUS_Sarmatian DA141.SG DA141 M RUS_Sarmatian DA139.SG DA139 F RUS_Sarmatian DA136.SG DA136 M RUS_Sarmatian DA134.SG DA134 M RUS_Sarmatian I0575 I0575 M RUS_Sarmatian I0574 I0574 F RUS_Sarmatian Pr4.SG Pr4 M RUS_Sarmatian Pr10.SG Pr10 M RUS_Sarmatian chy001.SG chy001 F RUS_Sarmatian chy002.SG chy002 M RUS_Sarmatian tem002.SG tem002 M RUS_Sarmatian tem001.SG tem001 F RUS_Sarmatian tem003.SG tem003 M RUS_Sarmatian Според мен тези неща са излишни. Не сме от вчера и знаем какво е положението с критиката. Може да е неприятно и да създава някои проблеми, но без критика човек се отпуска и почва да пише глупости. Съдейки по глупостите, които изскачат от време на време, явно в българските археогенетични среди липсва нужната критика. Тъй че вместо да се оплакваш, трябва да черпиш
  14. Строго погледнато, горната ф4 статистика не е достатъчна за такива изводи, понеже 1) може да има паразитен сигнал от КЛС и 2) зетките около Капитан Андреево не дават никаква надеждност. Затова се опитах да прецизирам ямненския компонент във византиеца с помощта на аутгруп ф3: Тези стойности са на база 80к снипа в ф2 блокове, защото иначе маймуната се инати. А се наложи да прибегна до нейна помощ, защото двамата негри дават различни резултати. В статистиката на Мбути византиецът се групира плътно с микенците, КА и българския халколит (там има Ямна, нищо че е халколит). В статистиката на Йоруба се групира с Джюлюница. Маймуната подкрепя този вариант - плътно с Джулюница. Извод: византиецът най-вероятно има Ямна колкото Джулюница или малко по-малко. Но все пак е само една проба, при това не особено качествена, тъй че нека бъдем предпазливи. А виж, колко Ямна има в Джюлюница - това е отделен въпрос
  15. Всъщност Лазаридис е прав, просто моделът му е грешен. В българския византиец има много ясен ямненски сигнал, вероятно на капитанандреевско ниво: Изобщо, тази византийска проба се очертава крайно интересна...
  16. Не. Общо са над 20к проби от 16к индивида. Това за голямата база, с модерните (v54.1.p1_HO_public). За останалото си прав. Аз по принцип съм отделил най-тлъстата проба от всеки индивид и само нея включвам в популацията, ама няма да ти казвам каква играчка е да се програмира тоя филтър върху мърлявата база на Райх. Изобщо, имам чувството, че тия в Харвард нямат айтита, ами някакви биолози пишат по файловете. Или пари не им се дават...
  17. Сега за пълнотата на горните модели. Кавказките алани дават много устойчив източноазиатски сигнал, за разлика от салтовците: Хубави мазни зетки, които правят долния модел доста силен, с около 5-6% ИА: Салтово: Според мен тук работата е доста съмнителна, но и покритието е ниско. Да видим какво ще покажат другите салтовски проби от новите руски изследвания.
  18. По този върос Г25 и qpAdm горе-долу са в съгласие един с друг: В тази популация влизат всички кавказки алани: и "ядрото" от предните ми постове, и аутлаерът, и един алан с ниско покритие, който липсва в Г25. Моделът е много добър и се подкрепя от другите статистики (което не означава, че е пълен). Само сърбите издишат, но те и така са си около процент, та не е фатално. Салтовците са рехави откъм статистическа значимост - и тримата са сниско покритие. Обединеният им представител в Г25 даже и след обединението е слабичък по стандартите на Давидски, но въпреки това сходството на двата модела (Г25 и qpAdm) дава основание да се приемат за читави:
  19. Има общо 16 635 индивида. От тях 3 са в четири варианта, 224 са в три варианта, а 3439 са в два варианта. Ако нещо не съм объркал брояча. Скриптче: f_ind = "C:/AdmixTools/Dataset/v54.1.p1_HO_public_original.ind" t_ind = fread( f_ind, header = FALSE, col.names = c( 'ID', 'Sex', 'Population')) id_chunks = "\\.EC|\\.SG|\\.DG|\\.HO|_d|_noUDG|_all|_enhanced|_final_provisional|-ALL_DATA|_alt" t_ind$ID = str_replace_all( t_ind$ID, id_chunks, '') view( unique( t_ind[, `:=` (N = .N, Population = .SD[[1,2]]), by = ID])[order( -N)]) Ще извиняваш за дърварското изпълнение, ама не сме на конкурс за кодери

За нас

"Форум Наука" е онлайн и поддържа научни, исторически и любопитни дискусии с учени, експерти, любители, учители и ученици.

За своята близо двайсет годишна история "Форум Наука" се утвърди като мост между тези, които знаят и тези, които искат да знаят. Всеки ден тук влизат хиляди, които търсят своя отговор.  Форумът е богат да информация и безкрайни дискусии по различни въпроси.

Подкрепи съществуването на форумa - направи дарение:

Дари

 

 

За контакти:

×
×
  • Create New...
/* Revenue-Ads-Footer */ /* За дарение */
×

Подкрепи форума!

Дори малко дарение от 5-10 лева от всеки, който намира форума за полезен, би направило огромна разлика. Това не е просто финансова подкрепа - това е вашият начин да кажете "Да, този форум е важен за мен и искам да продължи да съществува". Заедно можем да осигурим бъдещето на това специално място за споделяне на научни знания и идеи.