Забелязахме, че използвате Ad Blocker

Разбираме желанието ви за по-добро потребителско изживяване, но рекламите помагат за поддържането на форума.

Имате два варианта:
1. Регистрирайте се безплатно и разглеждайте форума без реклами
2. Изключете Ad Blocker-а за този сайт:
    • Кликнете върху иконата на Ad Blocker в браузъра
    • Изберете "Pause" или "Disable" за този сайт

Регистрирайте се или обновете страницата след изключване на Ad Blocker

Отиди на
Форум "Наука"

Кухулин

Потребител
  • Брой отговори

    4946
  • Регистрация

  • Последен вход

  • Days Won

    15

ВСИЧКО ПУБЛИКУВАНО ОТ Кухулин

  1. Хммм. Формално ф4 също потвърждава, че Ряховец има по-висок ИЕЛС компонент, отколкото КЛС... > f4 (dataset, "BGR_Ryahovets_Mdv", "Mbuti.DG", "EHG", "CHG") ℹ Getting population combinations... ℹ 1 population combinations found ℹ Computing from f4 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 1150639 SNPs... ℹ Computing 1 f4-statistics for block 713 out of 713... ℹ Summarize across blocks... # A tibble: 1 × 9 pop1 pop2 pop3 pop4 est se z p n <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 BGR_Ryahovets_Mdv Mbuti.DG EHG CHG 0.00309 0.000515 6.01 0.00000000189 779763 >
  2. Ряховец директно от файла, всяка ф4 с максимум наличи снипове. Не знам какво повече да му бая, че да заприлича на ЮД. > qpadm (dataset, pops_SA_left, pops_SA_right, 'BGR_Ryahovets_Mdv', allsns = T) ℹ Reading metadata... ℹ Computing block lengths for 1150639 SNPs... ℹ Computing 45 f4-statistics for block 713 out of 713... ℹ Number of SNPs after excluding those with missing data: 30201 ℹ Computing admixture weights... ℹ Computing standard errors... ℹ Computing number of admixture waves... warning: solve(): system is singular (rcond: 2.09067e-18); attempting approx solution warning: solve(): system is singular (rcond: 5.1679e-18); attempting approx solution warning: solve(): system is singular (rcond: 1.21638e-17); attempting approx solution $weights # A tibble: 5 × 5 target left weight se z <chr> <chr> <dbl> <dbl> <dbl> 1 BGR_Ryahovets_Mdv CHG 0.240 0.0817 2.93 2 BGR_Ryahovets_Mdv EHG 0.273 0.0765 3.56 3 BGR_Ryahovets_Mdv Levant_PPN 0.137 0.121 1.13 4 BGR_Ryahovets_Mdv SRB_Iron_Gates_HG 0.0218 0.0532 0.409 5 BGR_Ryahovets_Mdv TUR_Marmara_Barcin_N 0.329 0.125 2.62 $rankdrop # A tibble: 5 × 7 f4rank dof chisq p dofdiff chisqdiff p_nested <int> <int> <dbl> <dbl> <int> <dbl> <dbl> 1 4 5 3.50 6.23e- 1 7 115. 7.50e- 22 2 3 12 119. 1.10e- 19 9 165. 6.68e- 31 3 2 21 284. 6.29e- 48 11 498. 7.22e-100 4 1 32 782. 8.89e-144 13 2312. 0 5 0 45 3094. 0 NA NA NA $popdrop # A tibble: 31 × 16 pat wt dof chisq p f4rank CHG EHG Levant_PPN SRB_Iron_Gates_HG TUR_Marmara_Barcin_N feasible <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <lgl> 1 00000 0 5 3.50 6.23e- 1 4 0.240 0.273 0.137 0.0218 0.329 TRUE 2 00001 1 6 41.0 2.89e- 7 3 0.307 0.275 0.388 0.0306 NA TRUE 3 00010 1 6 14.9 2.14e- 2 3 0.239 0.293 0.133 NA 0.335 TRUE 4 00100 1 6 10.0 1.24e- 1 3 0.284 0.252 NA 0.0274 0.436 TRUE 5 01000 1 6 28.7 6.79e- 5 3 0.451 NA 0.104 0.148 0.298 TRUE 6 10000 1 6 21.6 1.44e- 3 3 NA 0.410 0.247 -0.0268 0.370 FALSE 7 00011 2 7 49.3 2.01e- 8 2 0.290 0.302 0.408 NA NA TRUE 8 00101 2 7 92.8 3.23e-17 2 0.828 0.0408 NA 0.131 NA TRUE 9 00110 2 7 22.3 2.30e- 3 2 0.279 0.278 NA NA 0.443 TRUE 10 01001 2 7 80.6 1.04e-14 2 0.617 NA 0.240 0.143 NA TRUE # ℹ 21 more rows # ℹ 4 more variables: best <lgl>, dofdiff <dbl>, chisqdiff <dbl>, p_nested <dbl> # ℹ Use `print(n = ...)` to see more rows > Дясната група: > pops_SA_right [1] "IRN_Ganj_Dareh_N" "ISR_Natufian_EpiP" "MAR_Taforalt_EpiP" "Mbuti.DG" "Mesopotamia" [6] "RUS_AfontovaGora3" "RUS_MA1_HG" "TUR_C_Boncuklu_PPN" "TUR_Pinarbasi_EpiP" "WHG" > В суплемента на Лазаридис: We describe the implementation of the stages of our protocol below. In all the analyses of this section we use the following set of 15 “Right” outgroup populations: Base: Mbuti.DG(407), CHG(7), EHG(8, 9), IRN_Ganj_Dareh_N(10), ISR_Natufian_EpiP(10), Levant_PPN(10), MAR_Taforalt_EpiP(408), Mesopotamia, RUS_AfontovaGora3(75), RUS_MA1_HG(409), SRB_Iron_Gates_HG(3), TUR_C_Boncuklu_PPN(410), TUR_Marmara_Barcın_N ((9) and this study), TUR_Pınarbaşı_EpiP(410), WHG(25, 75, 411)
  3. Мани майтапа, ама тоя qpAdm по три компонента е по-близо до Г25 и само по два - до ЮД Мойта сметка: target left weight se z <chr> <chr> <dbl> <dbl> <dbl> 1 BGR_Ryahovets_Mdv CHG 0.255 0.0815 3.13 2 BGR_Ryahovets_Mdv EHG 0.265 0.0746 3.56 3 BGR_Ryahovets_Mdv Levant_PPN 0.127 0.119 1.06 4 BGR_Ryahovets_Mdv SRB_Iron_Gates_HG 0.0317 0.0523 0.606 5 BGR_Ryahovets_Mdv TUR_Marmara_Barcin_N 0.321 0.120 2.68 Южната дъга: ID CHG EHG Levant_PPN SRB_Iron_Gates_HG TUR_Marmara_Barcın_N Population I10548 0.298 0.204 0.014 0.063 0.421 BGR_Ryahovets_Mdv Г25: И между другото екселският файл на ЮД не съвпада със суплемента...
  4. Мамицата им неандерталска и всякакви други цървули, оставили са ме с 500 снипа. Сега прекомпилирах само с Ряховец и излязох на 29734. Не че резултатът има нещо общо с Южната дъга, ама поне не стряска... Нещо не съм възхитен от възпроизвеждането на модела. Уж всичко е както пише в суплемента, ама гредичка. Сигурно трябва да се бърникне по опциите.
  5. Викам чакай ще пробвам да възпроизведа компонентите на Лазаридис. Оказа се, че съм голям оптимист # A tibble: 5 × 5 target left weight se z <chr> <chr> <dbl> <dbl> <dbl> 1 BGR_Ryahovets_Mdv CHG -0.573 1.36 -0.422 2 BGR_Ryahovets_Mdv EHG -0.556 1.72 -0.323 3 BGR_Ryahovets_Mdv Levant_PPN 2.26 2.90 0.780 4 BGR_Ryahovets_Mdv SRB_Iron_Gates_HG 0.204 1.11 0.185 5 BGR_Ryahovets_Mdv TUR_Marmara_Barcin_N -0.334 2.47 -0.135 Някакви идеи?
  6. Подобна история. Гледам на плота по-малки дистанции до съвременните и средновековните българи, отколкото до неолитните. И не знам каква е тази история в публикациите пробите да са групирани по един начин, а в базата на Райх - по друг. Изкуствено се създават пречки пред възпроизводството на резултатите. Но нас това няма как да ни спре Впрочем, нищо чудно някъде да седи .ind с оригиналните етикети, не съм търсил.
  7. А това са ф2/фст-дистанциите, които нито съответстват на аутгруп ф3, нито на реалния компонент ТМБ. f2(f2_blocks, "TUR_Barcin_N", pops) # A tibble: 5 × 4 pop1 pop2 est se <chr> <chr> <dbl> <dbl> 1 TUR_Barcin_N BGR_Ezero_EBA 0.0856 0.00172 2 TUR_Barcin_N BGR_KA_EIA 0.00842 0.000675 3 TUR_Barcin_N BGR_Late_C 0.0143 0.00101 4 TUR_Barcin_N BGR_Ryahovets 0.137 0.00203 5 TUR_Barcin_N Bulgarian.HO 0.00966 0.000439 Имам чувството, че тези функции са много чувствителни към естеството на пробите (брой, качество и др.), докато в Г25 всички тези фактори са елиминирани. Затова там простите дистанции може би са по-достоверни. Евентуално. С уговорки. Затова толкова хвалят Давидски, че знае как да ги филтрира и да ги гласи. Явно си е майсторлък.
  8. Това се нарича "outgroup f3" и идеята е тъкмо тази - че няма как да е отрицателна. Няма как ъгълът между векторите да е по-голям от 90 градуса, понеже маймуната е много-много далеч. Съответно колкото по-малък е резултатът, толкова по-къса е проекцията и толкова по-далеч е тестът от края на основния вектор - в случая КЛС. Пример за аутгруп ф3 върху родните популации: f3(f2_blocks, "Chimp.REF", "TUR_Barcin_N", pops) # A tibble: 5 × 7 pop1 pop2 pop3 est se z p <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> 1 Chimp.REF TUR_Barcin_N BGR_Ezero_EBA 0.233 0.00278 83.8 0 2 Chimp.REF TUR_Barcin_N BGR_KA_EIA 0.237 0.00258 91.8 0 3 Chimp.REF TUR_Barcin_N BGR_Late_C 0.238 0.00264 90.3 0 4 Chimp.REF TUR_Barcin_N BGR_Ryahovets 0.233 0.00294 79.1 0 5 Chimp.REF TUR_Barcin_N Bulgarian.HO 0.234 0.00253 92.7 0 Следователно в предния пост именно салтовският алан излиза по-близо до КЛС според ф3.
  9. С ф3 в салтовците също излиза повече КЛС: f3(f2_blocks, "Chimp.REF", "CHG.SG", pop) # A tibble: 2 × 7 pop1 pop2 pop3 est se z p <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> 1 Chimp.REF CHG.SG Russia_Alan_Core.SG 0.336 0.00198 170. 0 2 Chimp.REF CHG.SG Russia_SaltovoMayaki.SG 0.338 0.00209 162. 0 Значи, ако тълкуваме данните правилно, фст мери нещо друго.
  10. Търся кой алан има повече КЛС. Ф4 дава повече в салтовеца, фст дава в кавказкия (ако изобщо дава нещо): fst(prefix, pop1, c(pop3, pop4), adjust_pseudohaploid = FALSE) ℹ Reading allele frequencies from packedancestrymap files... ℹ v54.1.p1_1240K_public.geno has 16389 samples and 1233013 SNPs ℹ Calculating allele frequencies from 9 samples in 3 populations ℹ Expected size of allele frequency data: 168 MB 1233k SNPs read... ✔ 1233013 SNPs read in total ! 101701 SNPs remain after filtering. 51455 are polymorphic. ℹ Allele frequency matrix for 101701 SNPs and 3 populations is 10 MB ℹ Computing pairwise f2 for all SNPs and population pairs requires 59 MB RAM without splitting ℹ Computing without splitting since 59 < 8000 (maxmem)... ℹ Returning fst blocks # A tibble: 2 × 4 pop1 pop2 est se <chr> <chr> <dbl> <dbl> 1 CHG.SG Russia_Alan_Core.SG 0.468 0.00241 2 CHG.SG Russia_SaltovoMayaki.SG 0.801 0.00177 Ф3 засега не мога да я подкарам, утре ще я мисля.
  11. Така е, да. Три стандартни отклонения, по-известни като 3-сигма. Всичко под това е проява на доста лош вкус.
  12. Отворих нова тема за тези технически въпроси:
  13. f4(prefix, pop1, "Chimp.REF", pop3, pop4) ℹ Getting population combinations... ℹ 1 population combinations found ℹ Computing from f4 from genotype data... ℹ Reading metadata... ℹ Computing block lengths for 1150639 SNPs... ℹ Computing 1 f4-statistics for block 713 out of 713... ℹ Summarize across blocks... # A tibble: 1 × 9 pop1 pop2 pop3 pop4 est se z p n <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> 1 CHG.SG Chimp.REF Russia_Alan_Core.SG Russia_SaltovoMayaki.SG -0.00130 0.000832 -1.56 0.119 97493 Има някакъв прогрес в z, но си остава под 3. Ще мислим друго.
  14. За кавказките алани първо трябва да усвоим техниките. Вероятно ни очакват доста страници "усвояване".
  15. А защо тогава ф4 ги смята перфектно?
  16. Ако даваше вектор, халколитът щеше да е по-близо до неолита от желязото.
  17. Все още не съм постигнал вътрешно разбиране какво точно мери фст, но не мери това,което ми трябва:
  18. За сравнение Г25: Distance to: GEO_CHG 0.03737405 Georgia_UP_Satsurblia_(CHG) 0.13411982 RUS_Saltovo-Mayaki_low_res 0.15454193 RUS_Alan_MA Distance to: Georgia_UP_Satsurblia_(CHG) 0.03737405 GEO_CHG 0.15861718 RUS_Saltovo-Mayaki_low_res 0.18118461 RUS_Alan_MA Чиста работа, няма z-та p-та
  19. Хм. Реших да умъртвя малко мозъчни клетки, инсталирайки всички тези глупости. Резултатът: два невалидни теста: Сигурно нещо не сетвам както трябва. Ако знаете какво - казвайте.
  20. Има ги в екселския файл с 5-компонентния модел. Там пише кой в какъв клъстер влиза. Казва се science.abm4247_data_s5.xlsx, но не знам откъде съм го свалял.
  21. Този препринт е от миналата година и още не го публикуват. Според мен причината се крие във факта, че противоречи на Южната дъга. Цитирах го преди време в дискусиите за кавказкия компонент:
  22. Много силна връзка, особено при Стамболово: 2.9±16.3% И това в 4-компонентен модел, където не са включени нито Левант, нито Кавказ. А това са двата компонента на Месопотамия. За мен има две обяснения - или комбинация от много софтуер и малко мозък, или генериране на обем в публикацията. На това ниво първото е почти изключено, значи второто.
  23. Розово наистина е близо като дистанция, но при него има няколко специфики. 1) Пробата е късна (300 - 200 пне), т. е. след македонската "глобализация". 2) Кавказкият баланс (КЛС - ИЕЛС) е много висок - 19% (10% за КА, 9% за Джулюница). 3) 4-компонентният месопотамски модел на Лазаридис работи добре за тази проба - 30.1±6.6% при z = 4.563. Според мен това е достатъчно, за да разглеждаме пробата отделно от "местното" желязо. Но мнението ми е субективно, може да не съм прав. Мъжката линия наистина е довод, но пък 2500 години след появата и... Македонците... кой ги знае. Близки са, но се групират отделно. И изобщо там положението е много особено - не знаем какво представлява бронза, не знаем какви процеси протичат. Шантави проби, като започнем от шантавия неолит - 106%. И тая капитанандреевка за капак.
  24. Искам да ви запозная с най-новия член на клуб "КА" - една криптомакедонска лелка, избягала 400 км на запад I7233 / 50-55 yrs. / 900-809 calBCE / Vodovrati-Gradsko, North Macedonia

За нас

"Форум Наука" е онлайн и поддържа научни, исторически и любопитни дискусии с учени, експерти, любители, учители и ученици.

За своята близо двайсет годишна история "Форум Наука" се утвърди като мост между тези, които знаят и тези, които искат да знаят. Всеки ден тук влизат хиляди, които търсят своя отговор.  Форумът е богат да информация и безкрайни дискусии по различни въпроси.

Подкрепи съществуването на форумa - направи дарение:

Дари

 

 

За контакти:

×
×
  • Create New...
/* Revenue-Ads-Footer */ /* За дарение */
×

Подкрепи форума!

Дори малко дарение от 5-10 лева от всеки, който намира форума за полезен, би направило огромна разлика. Това не е просто финансова подкрепа - това е вашият начин да кажете "Да, този форум е важен за мен и искам да продължи да съществува". Заедно можем да осигурим бъдещето на това специално място за споделяне на научни знания и идеи.