
tantin
Потребител-
Брой отговори
6501 -
Регистрация
-
Последен вход
-
Days Won
25
Content Type
Профили
Форуми
Библиотека
Articles
Блогове
ВСИЧКО ПУБЛИКУВАНО ОТ tantin
-
Това се получи при една от извадките дето бях правил там с теб като гледахме оня клъстър. Иначе откъм историческо тълкуване изобщо не съм си правил труда да ровя . Когато имаме някакъв голям клъстър, тия дето са най-в центъра са първоизточника, началото. Колкото повече се отдалечаваме от клъстъра, генетичната дистанция се увеличава. В оня клъстър дето го гледахме КА се получават в центъра. Ако се добавят и още проби, може да се получат и други клъстъри. По принцип в клъстър се групират индивиди, дето имат общо засичане по множество принципни компоненти. Примерно по голямата част на принципните компоненти стойностите им са близки.. Обаче се появява някаква нова принципна компонента, където никой друг я няма, а тия от клъстара и само те я имат.. По това много лесно можем да ги изхващаме. И при това тия дето ще покажат максимум в тоя клъстър ще са най-ярките представители, основателите на клъстера.. С времето тия макс. компоненти на клъстъра се разреждат и растварят в околните популации.
-
Дайте да коментираме пак за Мокрин. Изскача ми една близост от Джуджуана към Мокрин. А Джуджуаната от своя страна са най близко към късния бачокировец и пещерата Муерти. Тоест това са наследници на Европеиския палеолит. Обаче имаме западно европейски палеолитчици ЗЕЛС. И кавказки такива КЛС. Мокрин се очертават за най-добри кандидати да са наследници на автентичните балкански ловци събирачи БЛС... (БЛРС) български ловно рибарски съюз. Нали улавяте тънката разлика: БЛС са балканци, автохонисти.
-
Сниповете си вървят с огромен излишък от информация. Можеш да вземеш само 1-ва хромозома и да направиш ПСА по нея. Можеш да направиш ПСА само по втора хромозома. Можеш да си направиш ПСА по първите 10 хромозоми и отделно да си направиш ПСА по вторите 10.. Повярвяй ми че картинката ще се различава, но принципно си се запазва . Става по-размазана, не на фокус. Но Подредбата в много отношения се запазва. При по-малък брой снипове се прави филтриране и трябва все пак да се покрие някакво минимално покритие , да речем поне на 60% . Ако липсват много снипове то ПСА софтуера дава отказ . Има обаче техники където може много точно да се предвиди и изчисли къде се проектират старите спрямо новите... И обратното: къде се проектират съвременните спрямо древните.. Не мога да кажа как точно хората на Райх го правят в SmartPCA .. Нито пък знаем как Давидски си генерира данните за Г25. Митохондриалната и У хромозомата са също частни случаи на автозомното ПСА... При автозомното (цялостното) разглеждане информацията постъпва паралелно по всичките 23 или 22 хромозоми / изключват се половите/ , обаче се получава наслагване, сумиране.. Все едно че рисуваме картина с 22 цвята.. Можем да нарисуваме картината само с 1 цвят и пак ще разберем какво е нарисувано. Но ако добавим всичките 22 цвята ще се получим максимална реалистичност.
-
Проблема на тоя плот е че ползва данните от Г25.. А тия данни не стават за прецизни измервания. Стандартното показване на ПСА е приблизително такова: Обаче са възможни най-различни завъртания, смяна на основните компоненти, проектиране по други оси и прочие. За да се ориентираме в разположението е най-добре да ползваме основните референтни групи, примерно тия дето съм ги показал тука. В графиката на Кухулин тези референти групи ги няма, без тях трудно може да даваме каквато и да било оценка.
-
Това не е ли същото интервю дето Чобанов си разправя за сармати и кавказ, а журналистката слага заглавие че сме наследници на Атила?
-
https://en.wikipedia.org/wiki/Caucasian_race Освен използването му в антропологията и свързаните с нея области, терминът "кавказки" често се използва в Съединените щати в различен социален контекст, за да опише група, обикновено наричана "бели хора". „Бели“ също се ползва като група за самоопределяне в преброяванията в САЩ. Най-грубо казано можем да гледаме на КЛС като предци на кавказката раса, тоест белите. Погледнете статията на уикипедия за кавказката раса, там е казано доста.
-
Пробвайте да разгледате тоя файл. Как е ? xyd_alans.zip
-
няма проблем ! А ето как е Ф4 погледнато през Уст-Ишим: Същата работа. Подредбата се запазва. Единственото- нулата е през уст-ишимеца.. и съответно тия около нулата са най-близките до него.. Просто ползваме уст-ишимеца като център, от който правим тестови вектори към всички участници.. Но е все едно че си работим в тримерното пространство.. Това е идеален пример дето няма размествания.. Обаче в реалния живот в многомерните пространства това е изключение, частен случай.. В действителност при други комбинации са възможни много драматични промени в подредбата.. Как да го кажем най-просто: пътя от шимпанзето до бразилските джунгли е най-дългия път на Хомо Сапиенса.. Всякакви разни човешки разновидности са производни и отклонения от тоя път.. Но не сме се пуснали да гледаме пътя към нова Зеландия... Има и други изненади.. Почакайте и ще видите..
-
Аз предпочитам да ти ги покажа по следния начин: Това ни дава кои са най-близко до сарматите. Тия до нулата са близки на сарматите.. А ако искаме да видим кои са близки до аланите ползвам следното: Чак ми е трудно да повярвам че не се получи никаква разлика в подреждането. Но все пак нулата на втората графика минава през аланите, а на първата графика е през сарматите.
-
Ето я и същинската Ф4 функция с реалните резултати: Както го казах по предварителна прогноза Ф4 ще е близко до нулата, защото по абсолютна стойност алани-сармати са наблизко. Заради посоката на вектора наблюдаваме по-малки и по-големи стойности. Малкия вектор си е с постоянна посока. А големия вектор обикаля по всички, но няма как да варира много, щото всичките извън африка са на много прилична дистанция от шимпанзето и мбути. В комбинация с малкия размер на малкия вектор получаваме Ф4 +/- стойности около нулата.. Все пак като най-важен резултат: испанския Чан е доста отдалечен. Не знам дали това изобщо върши някаква работа ? Все пак за тоя резултат участват цели 2577 снипа.. i HumanOrg_Dzudz.geno has 5975 samples and 1233013 SNPs i Calculating allele frequencies from 78 samples in 28 populations ! 2577 SNPs remain after filtering. 2259 are polymorphic. i Allele frequency matrix for 2577 SNPs and 28 populations is 1 MB i Computing pairwise f2 for all SNPs and population pairs requires 43 MB RAM without splitting i Computing without splitting since 43 < 8000 (maxmem)...
-
Не знам защо ,но в тая база са така: По принцип би трябвало да са от една група но 164 са го дали отделно. Тези RUS_Alan вече ги бях включил, така че няма защо пак да ги добавям. И те са единствените от тая група, освен тях други няма.. Със сарматите положението е следното, ДР са дали следните групи: RUS_Sarmatian RUS_EarlySarmatian_SouthernUrals.SG KAZ_Sarmatian KAZ_Nomad_Hun_Sarmatian Да речем че си харесаме руските сармати.. Да видим какво ще излезе.. По принцип тоя вектор сармати -алани е много къс.. Има посока , има и дължина. Заради дължината проекцията очакваме да е малка по всички направления. Но допълнителни заради перпендикулярността там където са нулевите стойности ще имаме по-голяма близост към стъблото на "дървото".. Сега пускам сметките и да видим какво ще покаже сабята..
-
Не знам какво да кажа приятелю... С тия в централна Азия ми е много трудно да се ангажирам с едние или с другите.. Алани, CHG, иранците.. че дори и финландците.. Трудно е да бъдат разграничени. Едно примерче: Ходи че ги разграничавай как искаш.. Салтово - маяцките ми изглеждат повече като азиатци отколкото европейци, но знае ли се какво се знае ? За някакви базови цели Ф4 може да ни даде идея.. тая картинка е с около 5090 SNPs and 24 populations.. Calculating allele frequencies from 54 samples in 24 populations В дадената от мен картинка има и индивиди, има и групи.. Според това как на мен ми оттърва. Примерно тия от са 4675 DA188.SG M RUS_SaltovoMayaki 4676 DA189.SG M RUS_SaltovoMayaki 4677 DA190.SG M RUS_SaltovoMayak
-
Значи гледай картинката: Да речем че тези прави / вектори / съм ги дал донякъде случайно, донякъде смислено.. Ако трябва да проверяваме проекциите по тия прави / основни компоненти/ вършат ли ни работа тия прави или да ги изменим? Можем да вкараме също японци, китайци, финландци, EHG, Papua New Gunea - Australia. и други. Кавказците се падат по средата. Но в същото време са много особени.. Щото един германски антрополог дефинира цяла раса като "кавказка".. А става дума за "белите''.. Всякакви бели едва ли не по подразбиране се водят част от кавказката раса.. Това са остарели понятия разбира се, но във всяко старо и забравено нещо има и по нещо верно, някаква частица... Ние обаче разполагаме с Ф4.. Въпроса е кои да са ни основните вектори.. Чакам предложения.. После ще ви дам данни какво се получава.
-
Въпреки че тия салтово-маяцките алани са много окастрени, за най-елементарни базови сравнения можем да правим груби естимации. Застраховам се да кажа: много груби и повърхностни. Погледнах ги тия тримцата.. Допреди да ги включа в извадката бях паднал до само 900 снипа. А като ги включих за съжаление ми останаха само 90 снипа, по които да правим естимацията.. Представяш ли си: само 90 снипа от милион и 300 хил.. ....но дори и тия 90 може пак да ни стигнат за да понарисуваме това и онова. Как изглежда картинката през тия ключови 90 снипа: Нещо тия салтово-маяцките ми ги прати откъм азиатската страна; Нищо че са трима. Но аз по принцип на такива данни с много орязани снипове не им се доверявам. Предпочитам да имам поне няколко хилади снипа, а още по добре десетки хиляди.. Ако пък са стотици хиляди то достоверността нараства в десетки пъти.. Въобще има над какво да се замислим.. Информацията е закодирана с много излишък.. Достатъчно ни е да вземем една малка частичка и само на тая база можем да направим съвсем достоверна и надеждна прогноза за цялата картинка.. Аз това съм го пробвал и го казвам със 100% увереност. Изкривявания и грешки са възможни. Но когато имаш същите данни по 23 начина и вземеш средно аритметично то грешката пада на под 1/23 ...
-
Току що проверих за тия тримцата: салтово-маяцки: Няма нужда да се обединяват, ДР вече си ги е обединил и ги е сложил под групово име: RUS_SaltovoMayaki Има ги в последната база: v54.1p Дейвид си знае работата.. Някой път може и да го критикуваме, ама той си е най-добрия за момента.. Той я движи тая наука.
-
Въобще тая наука май си е упражнение и хоби за програмисти... Аз между другото не съм програмист, но си ги разбирам нещата, знам за какво става дума.. А хората на ДР са като екипи от конкуриращи се програмисти, надпреварват се кой какъв нов софтуер да изкара и кой по-добре да разгроми и разгадае тайната на ... древните... Дотука всеки от екипите е изкарал по 4-5 софтуера като инструментариум.. А тия дето не правят нов софтуер са като лузери.... Докато традиционалистите се напъват да ползват съществуващи инструменти разработчиците изкарат нов инструмент и отнасят / отвяват конкуренциата на десетки километри назад в съревнованието.. Налага се да се гледа переспективно.. Обаче без познания по многомерните вектори и най-добрите програмисти са гола вода...
-
Бачо Кухулине, вземи си инсталирай R-studio . После аз ще ти дам конвертираните данни. Ще ти дам малко скриптове и ще можеш и сам да си ги въртиш данните и да си правиш проверките.. Само ми кажи откъде искаш да започнеш.. Ти си ентусиаст, аз обичам ентусиазма.. Аз започнах с едни скриптове ... за кози.. Но генетиката работи на все същия принцип.. Дали изследваш кози, коне, кучета - пак може да ползваш същите принципи.. Тия последно и на мамутите бяха направили генетичното дърво.. Много яко се бърка и гледа по гените .. А математиката на многомерните вектори си е все същата..
-
От тая партида гледай кои имам: Но твоите ги нямам. За да влязат в моята извадка трябва качествения контрол да прескочи поне на 60- 70 % ..По-долните ги игнорирам. Ако искам да ги проверя с Ф4 - стигат ми дори 10 %.. Зависи какво искаме. Аз предпочитам ПСА с добър качествен показател.
-
Защо ги разединявам може да питаш? Най лесния пример са бачо-Кировците.. В тия официалните публикации всичките бачо-Кировци са набутани в една категория.. Bulgaria_BachoKiro_LatePleistocene Е да, ама бачо Кировците се набутват по съвсем различни категории ако ги тестваш поединично. Понякога така ги дават клъстърите, не знам как точно ги определят, но доста такива несъвместими индивиди ги набутат в един клъстер, вземат средно-аритметично, после си правят всякакви статистики и функции.. Усреднените популации пък си имат всичко, имат голямо покритие по всякакви снипове, имат присъствие на голям обхват.. Но точноста спада, образа става размазан. Аз предпочитам да намеря 1 представителен индивид и с него да си правя тестове. Но вероятно си има преимущества да се работи с усреднените популации.
-
Това с обединениет го мога. Знам как да го направя, въпреки че досега не съм го правил. Аз повече правя обратното- разединявам ги и ги тествам поединично.
-
Ще се включа, разбира се.. Само дето съм като трактор Белорус.. Трудно запалва. Веднъж като запали, няма грешка... Аз съм много горд с тия Ф4 статистики от последните дни. И аз като Южняка: имам какво да кажа, но кой ли ме пита и кой ли ще ме послуша? При мен аз мога да правя Qpadm тестове с примерно 25 популации. В някои случаи с до 50. Зависи от броя снипове. Колкото повече окастряме сниповете - повече народ. А колкото по-подробно гледаме с много снипове, броя пада. Най лесно се проверяват граничните стойности, тия като бразилци, лошбур, ескимосите , и пр. Аланите са едни такива междинни. Може се проектират и тук и там. Обаче не е така с тия крайните..
-
А това знаеш ли какво идва да ни подскаже ? Че при финландските Саами е бъкано с КЛС компонент.. Тоест финландците изобщо не са отдалечена крайна популация, а напротив.. Те са придобили значителен кавказки компонент.. Но естествено върха, максимума на кавказкия компонент си е при кавказците.. При фините тоя компонент е малко или много разреден... Но все пак нека подходим предпазливо, това са само предположения..
-
Тайнствения индивид е някакъв изкопаем от пещерата Джуджуана.. Същия тоя го е публикувал Лазаридис в пре-принт.. Обаче не са го публикували никъде официално. Хем го има, хем го няма.. И с пробата им е така. Хем я има някъде си, но на сайта на ДР го няма. Гледай тука каква интересна Ф4 се получава: Уж проверявам по финланците, а зад тях ми се струпват ЗЕЛС, CHG / Сацурблия / и митичното джуджуана.. Понеже нямам ЗК, тука правя интерполацията през устишимеца, той също е център-нападател, от най мощните в средата на терена.
-
Студено .. Сацурблия си го има по всичките бази, и маймуната също..