Забелязахме, че използвате Ad Blocker

Разбираме желанието ви за по-добро потребителско изживяване, но рекламите помагат за поддържането на форума.

Имате два варианта:
1. Регистрирайте се безплатно и разглеждайте форума без реклами
2. Изключете Ad Blocker-а за този сайт:
    • Кликнете върху иконата на Ad Blocker в браузъра
    • Изберете "Pause" или "Disable" за този сайт

Регистрирайте се или обновете страницата след изключване на Ad Blocker

Отиди на
Форум "Наука"

tantin

Потребител
  • Брой отговори

    6565
  • Регистрация

  • Последен вход

  • Days Won

    27

ВСИЧКО ПУБЛИКУВАНО ОТ tantin

  1. ако искаш да гледаш разтоянията, ползвай: fst() примерно fst( data, pop1 = ALANS , pop2 = mypop ) , където mypop са всичките
  2. Браво, добре си се потрудил. Добре си го настроил щом си стигнал до първи резултати. Отлично !
  3. Чак сега се ориентирах какво те правят с тоя клъстър: взимат усреднената стойност за целия клъстър и го моделират като сума от 5 компонента. Изчисляват каква е грешката / отклонението/ и някаква величина P - вероятност или разпределение, не ми се търси какво точно е. И понеже Р е най-високо в последната 16-та колона, то те приемат че тоя модел е най-правдоподобен.. И така Месопотамците се оказват наедно в моделчето заедно в ямненци, Левант и турския мармара-барсин.. Само че това си е чиста манджа с грозде. Щото първо на първо клъстъра ни е от кол до въже. Събрани от къде ли не. След това и компонентите на модела са още по голям кол и по-отъркано въжето.. И накрая месопотамци ни се привиждат на Балканите.. Да има да взема прабаба ми египетската принцеса.. Ей такива ми ти апроксимации е направил ЙЛ. Почвам да разбирам що Кухулин изнедоволства в предишен постинг.
  4. По-скоро си мисля че от бързане са претупали някои неща. Искали са по-бързо да публикуват резултат. Примерно за балканския клъстър: Хубаво, обаче индивидите ги няма. Има ги редовете, има ги съставните компоненти, но заглавията на индивидите ги нямаме. Кои са в Балканския клъстер? Имаме ги на картинката, дадени са че са общо 172 индивида. На стр. 188. Ето кои влизат в балканския им клъстър
  5. Сега го погледнах тоя клъстер в ексел файла им: той е огромен тоя клъстер и се слива с вкючително JOR_PPNB Boncuklu_PPN. Но това не е Балканския клъстер, а е някакъв комбиниран клъстер със 114 проби. Балканския го дават че има само 16 проби. И дори им дават разбивката по компоненти. Както казахме, това си е типичната дървовидна структура, подобно биологичните класификации, с всякакви клони, подклони, малки клончета и така.
  6. Аз не сам си давал труда да видя кои точно проби са към КА клъстера в официалната им публикация. Аз си пусках мои си сметки по данните и при мен също ми ги дава в подобен клъстер. По моята оценка тия от КА съдържат по-древни гени, един вид са предшестващи Микена и Миноя, но това го казвам много предпазливо.. Факт е обаче че са близки.. без значение в коя посока е стрелката. Примерно поглеждаш кавказки ловци събирачи или ЗЕЛС - разликата с КА / микенците е огромна... Поглеждаш бачокировците - от там до КА пак имаме огромна разлика. Обаче ако погледнеш BK - пещерата муерти, джуджуана и после Мокрин - КА - излизаме на нещо като права линия, последователност. И си се нареждат във времето. Един вид наслагваш ги един в друг.. След КА вероятно слагаме Микена, че дори и Миноя.. Но вече дистанциите при КА Микена Миноя са много малки и групирането по клъстъри става доста по-проблематично.
  7. Хората ясно го обясняват: изпробвали са 5 начина за групиране в клъстери. При това са сравнявали получените извадки по време, география, археология и прочие и са търсили някакво по значимо разпределение. Така получените клъстери по 5-те метода са ги сравнили, търсили са такова групиране, дето примерно да се повтаря и при 5-те метода. Идеята е да се намерят такива стабилни групи, дето да не се разпадат с най-малка промяна на критериите. И горе долу са намерили някакво такова по-стабилно разпределение, дето по който и метод да се разгледа да има някакво практическо значение и обяснение. Основната база за разпределяне в клъстери се формира от ПСА данните. Гледат се разтоянията между всеки 2 индивида. Това може да се прави и през Ф2 статистиките. Софтуер предлагащ такова групиране в клъстери е йерархическите клъстери. Примерно задаваш някаквъв коефициент =14 - да речем че искаме да групираме цялата база в 14 групи. Можем и на 150 групи да ги разделим. Има програми дето да предложат оптималния коефициент, борй на клъстерите. Има различни математически методи за апроксимация и групиране.. Тоест самото групиране в клъстери е повече софтуер, математика и алгоритми. Но те му правят и преглед през география , време, археология.. И така дават тяхна си версия с такива клъстери.. Но пак да си го кажем че това не е абсолютно , еднозначно и финално решение.. В следваща публикация може да излязат с друго групиране.
  8. За да ги разбереш тези клъстери трябва да видиш към оригиналната публикация: с кой софтурер са ги изчислявали, на какъв критерий са ги разделили и прочие. Щото само да смениш малки параметри по настройките и ще получуш други клъстери. Или пък един и същи клъстер може да го разцепиш на още под-клъстери. В общи линии това е относително. Но нека да кажем няколко принципа за формиране на клъстерите: 1. област с близки стойности на индивидите: групират се в някаква област, разтоянията между индивидите са в рамките на някакви стойности. 2. Групиране около един или няколко индивида. На мен тези ми се струват по-надеждни клъстери. Измерва се разтоянието до централния индивид. Примерно избираш 50-те най-близки индивида. Обаче изобщо не е задължително всичките 50 да са част от 1 клъстер. Възможно е само първите 5 да са в клъстера, а другите 45 да са някъде много надалеч. Аз мога да ти дам и трети още по-строг критерий за клъстер. Понеже мерките са много-дименсионни, клъстер е област в която разтоянието от центъра на клъстъра до периферията е такова че разтоянието между отделните точки в периферията е по-голямо отколкото разтоянието до центъра. Това дори няма точна аналогия в 3-мерното пространство, тоест има аналогия, но е по-особено. Примерно взимаш една сфера и вписваш в нея такава фигура, дето разтоянията между ръбовете да са по-големи отколкото разтоянието до центъра.. Ето това е пример за клъстър около центъра на тая сфера.. Е представи си сега че КА са център на подобна сфера.
  9. Нещо ново и свежо: Току що мярнах линк към това видео от сайта на евроджинс - Давидски. Още по-интересното е че го води българката Бисерка Гайдарска.. Приятно гледане.
  10. Бачо Кухулине, остави ги тия Г25, вземи си инсталирай R-studio, и ако искаш може да си ровиш в данните колкото си искаш. Но тия балканските групи са много наблизко. Има тук таме нещо архаично да изскача, но много трудно дори да кажеш откъде се е пръкнало, може да е от Азия, може от Леванта, може и от Сев.Африка. Като се засече някаквъв ясен сигнал е доста по-лесно. Но примерно Етруските: ясно се групират в клъстер, при това клъстера им е Европейски, централно Европейски. Ходи ги доказвай че били Азиатци от Мала Азия.. За момента най-преспективни ми се виждат Мокрин, има също едни хърватски от Попова Нива мисля.. С Г25 нищо не може да се каже и докаже, понеже броя на основните компоненти е малък. Трябва да се гледат повечко компоненти за да се гледа в подробности, с голяма разделителна способност. Основните компоненти ни дават инфо за общото положение. Ако искаш да гледаш локални подробности: 2 начина .. 1. Ползваш много компоненти.. 2. Взимаш локална извадка и правиш детайлен пс анализ само за тая извадка, за да изскочат локалните и принципни компоненти.
  11. Това се получи при една от извадките дето бях правил там с теб като гледахме оня клъстър. Иначе откъм историческо тълкуване изобщо не съм си правил труда да ровя . Когато имаме някакъв голям клъстър, тия дето са най-в центъра са първоизточника, началото. Колкото повече се отдалечаваме от клъстъра, генетичната дистанция се увеличава. В оня клъстър дето го гледахме КА се получават в центъра. Ако се добавят и още проби, може да се получат и други клъстъри. По принцип в клъстър се групират индивиди, дето имат общо засичане по множество принципни компоненти. Примерно по голямата част на принципните компоненти стойностите им са близки.. Обаче се появява някаква нова принципна компонента, където никой друг я няма, а тия от клъстара и само те я имат.. По това много лесно можем да ги изхващаме. И при това тия дето ще покажат максимум в тоя клъстър ще са най-ярките представители, основателите на клъстера.. С времето тия макс. компоненти на клъстъра се разреждат и растварят в околните популации.
  12. Дайте да коментираме пак за Мокрин. Изскача ми една близост от Джуджуана към Мокрин. А Джуджуаната от своя страна са най близко към късния бачокировец и пещерата Муерти. Тоест това са наследници на Европеиския палеолит. Обаче имаме западно европейски палеолитчици ЗЕЛС. И кавказки такива КЛС. Мокрин се очертават за най-добри кандидати да са наследници на автентичните балкански ловци събирачи БЛС... (БЛРС) български ловно рибарски съюз. Нали улавяте тънката разлика: БЛС са балканци, автохонисти.
  13. Стигнали ли са полинезийците до Америка? Най-новите отговори на такива въпроси идват от генетиката.
  14. Сниповете си вървят с огромен излишък от информация. Можеш да вземеш само 1-ва хромозома и да направиш ПСА по нея. Можеш да направиш ПСА само по втора хромозома. Можеш да си направиш ПСА по първите 10 хромозоми и отделно да си направиш ПСА по вторите 10.. Повярвяй ми че картинката ще се различава, но принципно си се запазва . Става по-размазана, не на фокус. Но Подредбата в много отношения се запазва. При по-малък брой снипове се прави филтриране и трябва все пак да се покрие някакво минимално покритие , да речем поне на 60% . Ако липсват много снипове то ПСА софтуера дава отказ . Има обаче техники където може много точно да се предвиди и изчисли къде се проектират старите спрямо новите... И обратното: къде се проектират съвременните спрямо древните.. Не мога да кажа как точно хората на Райх го правят в SmartPCA .. Нито пък знаем как Давидски си генерира данните за Г25. Митохондриалната и У хромозомата са също частни случаи на автозомното ПСА... При автозомното (цялостното) разглеждане информацията постъпва паралелно по всичките 23 или 22 хромозоми / изключват се половите/ , обаче се получава наслагване, сумиране.. Все едно че рисуваме картина с 22 цвята.. Можем да нарисуваме картината само с 1 цвят и пак ще разберем какво е нарисувано. Но ако добавим всичките 22 цвята ще се получим максимална реалистичност.
  15. Проблема на тоя плот е че ползва данните от Г25.. А тия данни не стават за прецизни измервания. Стандартното показване на ПСА е приблизително такова: Обаче са възможни най-различни завъртания, смяна на основните компоненти, проектиране по други оси и прочие. За да се ориентираме в разположението е най-добре да ползваме основните референтни групи, примерно тия дето съм ги показал тука. В графиката на Кухулин тези референти групи ги няма, без тях трудно може да даваме каквато и да било оценка.
  16. Това не е ли същото интервю дето Чобанов си разправя за сармати и кавказ, а журналистката слага заглавие че сме наследници на Атила?
  17. https://en.wikipedia.org/wiki/Caucasian_race Освен използването му в антропологията и свързаните с нея области, терминът "кавказки" често се използва в Съединените щати в различен социален контекст, за да опише група, обикновено наричана "бели хора". „Бели“ също се ползва като група за самоопределяне в преброяванията в САЩ. Най-грубо казано можем да гледаме на КЛС като предци на кавказката раса, тоест белите. Погледнете статията на уикипедия за кавказката раса, там е казано доста.
  18. Пробвайте да разгледате тоя файл. Как е ? xyd_alans.zip
  19. няма проблем ! А ето как е Ф4 погледнато през Уст-Ишим: Същата работа. Подредбата се запазва. Единственото- нулата е през уст-ишимеца.. и съответно тия около нулата са най-близките до него.. Просто ползваме уст-ишимеца като център, от който правим тестови вектори към всички участници.. Но е все едно че си работим в тримерното пространство.. Това е идеален пример дето няма размествания.. Обаче в реалния живот в многомерните пространства това е изключение, частен случай.. В действителност при други комбинации са възможни много драматични промени в подредбата.. Как да го кажем най-просто: пътя от шимпанзето до бразилските джунгли е най-дългия път на Хомо Сапиенса.. Всякакви разни човешки разновидности са производни и отклонения от тоя път.. Но не сме се пуснали да гледаме пътя към нова Зеландия... Има и други изненади.. Почакайте и ще видите..
  20. Аз предпочитам да ти ги покажа по следния начин: Това ни дава кои са най-близко до сарматите. Тия до нулата са близки на сарматите.. А ако искаме да видим кои са близки до аланите ползвам следното: Чак ми е трудно да повярвам че не се получи никаква разлика в подреждането. Но все пак нулата на втората графика минава през аланите, а на първата графика е през сарматите.
  21. Ето я и същинската Ф4 функция с реалните резултати: Както го казах по предварителна прогноза Ф4 ще е близко до нулата, защото по абсолютна стойност алани-сармати са наблизко. Заради посоката на вектора наблюдаваме по-малки и по-големи стойности. Малкия вектор си е с постоянна посока. А големия вектор обикаля по всички, но няма как да варира много, щото всичките извън африка са на много прилична дистанция от шимпанзето и мбути. В комбинация с малкия размер на малкия вектор получаваме Ф4 +/- стойности около нулата.. Все пак като най-важен резултат: испанския Чан е доста отдалечен. Не знам дали това изобщо върши някаква работа ? Все пак за тоя резултат участват цели 2577 снипа.. i HumanOrg_Dzudz.geno has 5975 samples and 1233013 SNPs i Calculating allele frequencies from 78 samples in 28 populations ! 2577 SNPs remain after filtering. 2259 are polymorphic. i Allele frequency matrix for 2577 SNPs and 28 populations is 1 MB i Computing pairwise f2 for all SNPs and population pairs requires 43 MB RAM without splitting i Computing without splitting since 43 < 8000 (maxmem)...
  22. Не знам защо ,но в тая база са така: По принцип би трябвало да са от една група но 164 са го дали отделно. Тези RUS_Alan вече ги бях включил, така че няма защо пак да ги добавям. И те са единствените от тая група, освен тях други няма.. Със сарматите положението е следното, ДР са дали следните групи: RUS_Sarmatian RUS_EarlySarmatian_SouthernUrals.SG KAZ_Sarmatian KAZ_Nomad_Hun_Sarmatian Да речем че си харесаме руските сармати.. Да видим какво ще излезе.. По принцип тоя вектор сармати -алани е много къс.. Има посока , има и дължина. Заради дължината проекцията очакваме да е малка по всички направления. Но допълнителни заради перпендикулярността там където са нулевите стойности ще имаме по-голяма близост към стъблото на "дървото".. Сега пускам сметките и да видим какво ще покаже сабята..
  23. Не знам какво да кажа приятелю... С тия в централна Азия ми е много трудно да се ангажирам с едние или с другите.. Алани, CHG, иранците.. че дори и финландците.. Трудно е да бъдат разграничени. Едно примерче: Ходи че ги разграничавай как искаш.. Салтово - маяцките ми изглеждат повече като азиатци отколкото европейци, но знае ли се какво се знае ? За някакви базови цели Ф4 може да ни даде идея.. тая картинка е с около 5090 SNPs and 24 populations.. Calculating allele frequencies from 54 samples in 24 populations В дадената от мен картинка има и индивиди, има и групи.. Според това как на мен ми оттърва. Примерно тия от са 4675 DA188.SG M RUS_SaltovoMayaki 4676 DA189.SG M RUS_SaltovoMayaki 4677 DA190.SG M RUS_SaltovoMayak
  24. Значи гледай картинката: Да речем че тези прави / вектори / съм ги дал донякъде случайно, донякъде смислено.. Ако трябва да проверяваме проекциите по тия прави / основни компоненти/ вършат ли ни работа тия прави или да ги изменим? Можем да вкараме също японци, китайци, финландци, EHG, Papua New Gunea - Australia. и други. Кавказците се падат по средата. Но в същото време са много особени.. Щото един германски антрополог дефинира цяла раса като "кавказка".. А става дума за "белите''.. Всякакви бели едва ли не по подразбиране се водят част от кавказката раса.. Това са остарели понятия разбира се, но във всяко старо и забравено нещо има и по нещо верно, някаква частица... Ние обаче разполагаме с Ф4.. Въпроса е кои да са ни основните вектори.. Чакам предложения.. После ще ви дам данни какво се получава.
  25. Въпреки че тия салтово-маяцките алани са много окастрени, за най-елементарни базови сравнения можем да правим груби естимации. Застраховам се да кажа: много груби и повърхностни. Погледнах ги тия тримцата.. Допреди да ги включа в извадката бях паднал до само 900 снипа. А като ги включих за съжаление ми останаха само 90 снипа, по които да правим естимацията.. Представяш ли си: само 90 снипа от милион и 300 хил.. ....но дори и тия 90 може пак да ни стигнат за да понарисуваме това и онова. Как изглежда картинката през тия ключови 90 снипа: Нещо тия салтово-маяцките ми ги прати откъм азиатската страна; Нищо че са трима. Но аз по принцип на такива данни с много орязани снипове не им се доверявам. Предпочитам да имам поне няколко хилади снипа, а още по добре десетки хиляди.. Ако пък са стотици хиляди то достоверността нараства в десетки пъти.. Въобще има над какво да се замислим.. Информацията е закодирана с много излишък.. Достатъчно ни е да вземем една малка частичка и само на тая база можем да направим съвсем достоверна и надеждна прогноза за цялата картинка.. Аз това съм го пробвал и го казвам със 100% увереност. Изкривявания и грешки са възможни. Но когато имаш същите данни по 23 начина и вземеш средно аритметично то грешката пада на под 1/23 ...

За нас

"Форум Наука" е онлайн и поддържа научни, исторически и любопитни дискусии с учени, експерти, любители, учители и ученици.

За своята близо двайсет годишна история "Форум Наука" се утвърди като мост между тези, които знаят и тези, които искат да знаят. Всеки ден тук влизат хиляди, които търсят своя отговор.  Форумът е богат да информация и безкрайни дискусии по различни въпроси.

Подкрепи съществуването на форумa - направи дарение:

Дари

 

 

За контакти:

×
×
  • Create New...
×

Подкрепи форума!

Дори малко дарение от 5-10 лева от всеки, който намира форума за полезен, би направило огромна разлика. Това не е просто финансова подкрепа - това е вашият начин да кажете "Да, този форум е важен за мен и искам да продължи да съществува". Заедно можем да осигурим бъдещето на това специално място за споделяне на научни знания и идеи.