×ÛÊö£º·ÇģʽºÍÐÂÐËģʽÉúÎï»ùÒò×é²âÐòÓë×é×°µÄ¼òÒªÖ¸ÄÏ

¡¾×ÖÌ壺 ´ó ÖРС ¡¿ ʱ¼ä£º2025Äê04ÔÂ18ÈÕ À´Ô´£ºFrontiers in Zoology 2.6

±à¼­ÍƼö£º

¡¡¡¡±¾ÎÄÊǹØÓÚ·ÇģʽºÍÐÂÐËģʽÉúÎï»ùÒò×é²âÐòÓë×é×°µÄ×ÛÊö¡£Ïêϸ½éÉÜÁË»ùÒò×éÏîÄ¿¸÷½×¶Î²Ù×÷£¬ÈçǰÆÚ¾ö²ß¡¢DNA ÌáÈ¡¡¢²âÐòµÈ£¬¶Ô±È¶àÖÖ¼¼Êõ·½·¨£¬²ûÊöÖÊÁ¿ÆÀ¹ÀÓë×¢ÊÍÒªµã£¬ÎªÏà¹ØÑо¿Ìá¹©È«ÃæÖ¸µ¼£¬ÖúÁ¦»ùÒò×éѧÉîÈë̽Ë÷¡£

¡¡¡¡

»ùÒò×é²âÐòÓë×é×°µÄÖØÒªÒâÒå

»ùÒò×éѧÑо¿»ùÒòÐòÁм°ÆäÔÚÖÖȺºÍÎïÖÖ¼äµÄ²îÒ죬¶ÔÉúÎïѧ¡¢Ò½Ñ§ºÍũҵµÈÁìÓòÓ°ÏìÉîÔ¶¡£²Î¿¼»ùÒò×éÐòÁÐÊÇÑо¿»ùÒò¹¦ÄÜ¡¢ÎïÖÖ½ø»¯ºÍÉúÎï¶àÑùÐԵĹؼü»ù´¡¡£ÈËÀà»ùÒò×鼯»®£¨HGP£©¿ªÆôÁË»ùÒò×éÑо¿Ð¼ÍÔª£¬Ö®ºó¸ßͨÁ¿²âÐò¼¼ÊõÍÆ¶¯ÁË»ùÒò×éѧ¿ìËÙ·¢Õ¹£¬Ê¹´ó¹æÄ£±È½Ï»ùÒò×éѧÑо¿³ÉΪ¿ÉÄÜ¡£Èç½ñ£¬³¤¶Á³¤²âÐò¼¼ÊõµÄÓ¦ÓÃÈøßÖÊÁ¿»ùÒò×é×é×°³ÉΪÏÖʵ£¬ÕâÓÐÖúÓÚ¿ÆÑ§¼Ò½Òʾ¸ü¶àÒÅ´«ÐÅÏ¢£¬Íƶ¯ÉúÎïѧ¸÷ÁìÓò·¢Õ¹¡£

»ùÒò×éÏîÄ¿µÄÑо¿ÎÊÌâÓë²âÐò²ßÂÔ

²»Í¬µÄ»ùÒò×é·ÖÎöÎÊÌâÐèÒª²»Í¬µÄ²âÐò²ßÂÔ¡£µÍÖÁÖеȸ²¸Ç¶È£¨5¡Á - 20¡Á£©µÄ¶Ì¶Á³¤²âÐòÊÊÓÃÓÚÒÑÓвο¼»ùÒò×éµÄÖÖȺ»ùÒò×éѧÑо¿£¬¿ÉÓÃÓÚ¼ì²âÑ¡ÔñѹÁ¦ÏµĻùÒòºÍµ¥ºËÜÕËá¶à̬ÐÔ£¨SNP£©µÈ¡£µ«¶ÔÓÚ¹¹½¨ÐµIJο¼»ùÒò×飬´¿¶Ì¶Á³¤Êý¾Ý²¢²»ÀíÏ룬²»¹ýÔÚÄ³Ð©ÌØÊâÇé¿öÏ£¬ÈçÑù±¾ DNA ÖÊÁ¿²î»ò×ÊÔ´ÓÐÏÞʱ£¬¶Ì¶Á³¤×é×°ÈÔÄÜÌṩÓÐÓÃÐÅÏ¢£¬ÓÃÓÚÖÖȺ»ùÒò×éѧÖÐµÄ SNP ±È½Ï¡¢ºË±ê¼Ç·ÖÎöºÍÒýÎïÉè¼ÆµÈ¡£È¾É«ÌåˮƽµÄ»ùÒò×éÏîÄ¿³£Óó¤¶Á³¤²âÐò£¬½áºÏ Hi-C µÈ¸¨ÖúÐÅÏ¢¹¹½¨Ö§¼Ü£¬Ëä¿ÉÄÜ´æÔÚ²¿·Öδȷ¶¨ÐòÁУ¬µ«ÄÜÖ§³Ö±È½Ï»ùÒò×éѧÑо¿£¬·ÖÎö»ùÒò×é½á¹¹¡¢Ñ¡ÔñºÍ»ùÒò¼Ò×å½ø»¯£¬ÒÔ¼°Ì½¾¿»ùÒò×é´óС±ä»¯µÄÔ­Òò¡£¶ø¶ËÁ£µ½¶ËÁ££¨T2T£©µÄ¸ßÖÊÁ¿»ùÒò×é×é×°¿É½Òʾ»ùÒò×é½ø»¯µÄÒþ²Ø½á¹¹¶¯Ì¬£¬µ«Ä¿Ç°ÈÔÃæÁÙ×ŶËÁ£¡¢×ÅË¿Á£ºÍÐÔȾɫÌåµÈÇøÓò²âÐòµÄÌôÕ½¡£

»ùÒò×éÏîÄ¿µÄ²½Öè

  1. ÏîÄ¿Æô¶¯Ç°µÄ¾ö²ß£¨phase 1£©
    • Êý¾ÝÍÚ¾ò£ºÔÚÆô¶¯»ùÒò×éÏîĿǰ£¬ÐèÈ«ÃæËÑË÷¹«¹²Êý¾Ý¿âºÍÏà¹Ø»ùÒò×鼯»®£¬Á˽âÒÑÓеĻùÒò×éÊý¾ÝºÍÕýÔÚ½øÐеÄÏîÄ¿£¬±ÜÃâÖØ¸´Ñо¿¡£Genomes on a tree hub µÈƽ̨¿ÉÌá¹©È«ÃæµÄ»ùÒò×éÏîÄ¿ÐÅÏ¢¡£
    • È·¶¨»ùÒò×é´óСºÍ±¶ÐÔˮƽ£º×¼È·¹À¼Æ»ùÒò×é´óС¶Ô¼ÆËã²âÐòÊý¾ÝÁ¿ÖÁ¹ØÖØÒª£¬¿Éͨ¹ýÐòÁÐÎ޹ط½·¨£¨ÈçÁ÷ʽϸ°ûÊõ£©»ò»ùÓÚ²âÐòÊý¾ÝµÄÉúÎïÐÅϢѧ·½·¨£¨Èç k-mer ·ÖÎö£©½øÐвâÁ¿¡£´ËÍ⣬Á˽âÎïÖֵı¶ÐÔˮƽҲºÜÖØÒª£¬ÒòΪËü»áÓ°Ïì»ùÒò×éµÄ×é×°ºÍ×¢ÊÍ£¬¿Éͨ¹ýºËÐÍ·ÖÎöÈ·¶¨£¬µ«¸Ã·½·¨½ÏΪ·±Ëö£¬ÐÂÑо¿ÏîÄ¿¿ÉÄÜÄÑÒÔÔÚ²âÐòǰ»ñÈ¡Ïà¹ØÐÅÏ¢¡£
    • È·¶¨Ô¤ÆÚµÄ»ùÒò×éÖÊÁ¿ºÍ²âÐò·½·¨£º¸ù¾ÝÑо¿Ä¿µÄºÍÔ¤ËãÈ·¶¨Ô¤ÆÚµÄ»ùÒò×é×é×°ÖÊÁ¿£¬ÈçµÍ¸²¸Ç¶È¡¢È¾É«Ìåˮƽ»ò T2T ˮƽ¡£³¤¶Á³¤²âÐòÊÇÏÖ´ú»ùÒò×é²âÐòµÄºËÐÄ£¬PacBio ºÍÅ£½òÄÉÃ׿ף¨ONT£©¸÷ÓÐÓÅÁÓ£¬¶þÕß½áºÏ¿ÉÄÜ»ñµÃ¸üºÃµÄ×éװЧ¹û¡£ÈôÑо¿ÐèÒª·ÖÀëȾɫÌåµ¥±¶ÐÍ£¨phasing£©£¬¿É²ÉÓó¤¶Á³¤ºÍ Hi-C Êý¾Ý½áºÏµÄ·½·¨£¬»òÀûÓÃÇ××ÓÑù±¾µÄ¶Ì¶Á³¤Êý¾Ý¸¨Öú¡£
    • Ñù±¾Ñ¡Ôñ£ºÎª¼õÉÙÒÅ´«±äÒ죬ͨ³£ÓÅÏÈÑ¡Ôñµ¥¸ö¸öÌå½øÐлùÒò×é²âÐò¡£Èô±ØÐëʹÓöà¸ö¸öÌ壬Ӧ¾¡Á¿¼õÉÙÉúÎï²îÒ죬ÈçÑ¡Ôñ¿Ë¡¡¢Í¬Ò»Æ·Ïµ»òͬһҰÉúÖÖȺµÄ¸öÌ塣ѡÔñ×é֯ʱ£¬Ó¦±ÜÃ⳦µÀ×éÖ¯£¬Ñ¡Ôñº¬ÔÓÖÊÉÙµÄ×éÖ¯£¬Èç¼¹×µ¶¯ÎïµÄ´óÄÔ¡¢Æ¢ÔàµÈ¡£ÈôÒª½øÐÐ phasing£¬¿ÉÑ¡ÔñÇ××Ó trio Ñù±¾£¬Ò²¿ÉÀûÓÃ׼ȷµÄ³¤¶Á³¤Êý¾Ý»ò Hi-C Êý¾ÝʵÏÖ¡£
    • ³É±¾ºÍÉúÎïÐÅϢѧ×ÊÔ´¹ÀË㣺¸ù¾Ý»ùÒò×é´óСºÍÔ¤ÆÚ¸²¸Ç¶È¼ÆËãËùÐè²âÐòÊý¾ÝÁ¿£¬Í¬Ê±¿¼ÂÇÊý¾Ý¹ýÂ˺Ͷþ´Î²âÐòµÄÇé¿ö¡£³É±¾Òò²âÐò¹«Ë¾ºÍÄê·Ý¶øÒ죬ÉúÎïÐÅϢѧ×ÊÔ´ÐèÇóÖ÷Ҫȡ¾öÓÚ»ùÒò×é´óС¡¢¸²¸Ç¶ÈºÍÖØ¸´ÐòÁи´ÔÓ¶È¡£Ð¡ÐÍ»ùÒò×飨200 - 300 Mb£©ÔÚʵÑéÊÒ½øÐ㤶Á³¤²âÐòµÄºÄ²Ä³É±¾Ô¼Îª 500 - 1000 €£¬²¸È鶯Îï»ùÒò×飨3 Gb£©ÔòԼΪ 1000 €£¬µ«¹«Ë¾²âÐò³É±¾¿ÉÄܸü¸ß¡£»ùÒò×é×é×°ËùÐèµÄ¼ÆËã×ÊÔ´£¬ÈçÄÚ´æºÍºËÐÄÊý£¬Ò²Òò»ùÒò×é´óС¶øÒì¡£
  2. DNA ÌáÈ¡ºÍÈ«»ùÒò×éÀ©Ôö£¨phase 2£©
    • DNA ÌáÈ¡£º¸ßÖÊÁ¿µÄ¸ß·Ö×ÓÁ¿£¨HMW£©DNA Êdz¤¶Á³¤²âÐòµÄ¹Ø¼ü£¬ÐÂÏÊ»òËÙ¶³×éÖ¯Ñù±¾Îª¼Ñ¡£¶àÖÖ DNA ÌáÈ¡·½·¨¿É¹©Ñ¡Ôñ£¬¾­µäµÄ·Ó - Âȷ³Áµí·¨£¨PCI£©ËäÓÐЧ£¬µ«·ÓºÍÂȷ¾ßÓÐΣÏÕÐÔ¡£Ä¿Ç°ÓÐÐí¶àרÃÅÓÃÓÚ HMW DNA ÌáÈ¡µÄÉÌÒµÊÔ¼ÁºÐ£¬Èç MagAttract HMW DNA kit¡¢ZYMO HMW µÈ£¬ÕâЩÊÔ¼ÁºÐ¿ÉÌá¸ß²âÐòÊä³öºÍ×é×°³É¹¦ÂÊ¡£¶ÔÓÚ ONT ³¤¶Á³¤²âÐò£¬¸»¼¯³¤Æ¬¶Î¿ÉÔö¼Ó²úÁ¿£¬¿É²ÉÓö̶ÁÏû³ýÆ÷£¨SRE£©ÊÔ¼ÁºÐ¡¢´ÅÖé»ò BluePippin »úÆ÷µÈ·½·¨¡£
    • ³¤³Ì PCR / È«»ùÒò×éÀ©ÔöºÍ³¬µÍÊäÈëЭÒ飺µ± DNA Á¿ÓÐÏÞʱ£¬¿É²ÉÓó¤³Ì PCR / È«»ùÒò×éÀ©Ôö£¨WGA£©·½·¨¡£PacBio µÄ Ultra - Low Input DNA workflow ¿É´ÓÉÙÁ¿ DNA Éú³É¸ßÖÊÁ¿Êý¾Ý£¬µ« PCR À©Ôö»á¼õС²åÈëÆ¬¶Î´óС£¬ÇҸ÷½·¨ÊÊÓÃÓÚ»ùÒò×é´óС²»³¬¹ý 500 Mb µÄÎïÖÖ¡£¸ÄÁ¼ºóµÄ PacBio Ampli - Fi kit ¿É´¦Àí¸ü´ó»ùÒò×é¡£¶àÖØÖû»À©Ôö£¨MDA£©ÊÇÁíÒ»ÖÖ³£Ó÷½·¨£¬ÀûÓà phi29 DNA ¾ÛºÏø£¬ÄܲúÉú¸ß׼ȷÐÔÆ¬¶Î£¬µ«¿ÉÄÜ»á²úÉúǶºÏÐòÁС£
  3. ²âÐò£¨phase 3£©
    • Å£½òÄÉÃ׿׳¤¶Á³¤²âÐò£ºONT ²âÐò¼¼Êõͨ¹ýÄÉÃ׿׼ì²â DNA ·Ö×Óͨ¹ýʱµÄÀë×ÓµçÁ÷±ä»¯À´È·¶¨ DNA ÐòÁУ¬¿ÉÖ±½Ó¶ÁÈ¡³¤Æ¬¶Î DNA£¬¼ì²â¼î»ùÐÞÊΣ¬µ«´æÔÚ´íÎóÂʽϸߵÄÎÊÌâ¡£ONT ÎÄ¿âÖÆ±¸Í¨³£ÐèÒª½øÐÐÆ¬¶Î´óСѡÔñ£¬ÒÔ¸»¼¯³¤Æ¬¶Î DNA¡£²»Í¬µÄ ONT Á÷¶¯³Ø¾ßÓв»Í¬µÄ²âÐòÊä³ö£¬PromethION Á÷¶¯³Ø¿É´ÓÓÐÏÞµÄÆðʼ²ÄÁÏÖÐÉú³É´óÁ¿ÐòÁÐÊý¾Ý¡£ONT ÓжàÖÖÎÄ¿âÖÆ±¸ÊÔ¼ÁºÐ£¬Èç Rapid Sequencing Kit ÊÊÓÃÓÚ¿ìËÙÎÄ¿âÖÆ±¸£¬Ligation Sequencing Kit£¨LSK£©¿É»ñµÃ½Ï³¤¶Á³¤£¬½áºÏ NEB Monarch HMW DNA ÌáÈ¡ÊÔ¼ÁºÐºÍ Ultralong Sequencing Kit ¿ÉÓÅ»¯¶Á³¤ÐÔÄÜ¡£
    • PacBio ³¤¶Á³¤²âÐò£ºPacBio ²ÉÓõ¥·Ö×Óʵʱ£¨SMRT£©²âÐò¼¼Êõ£¬Í¨¹ý¼ì²âÓ«¹â±ê¼ÇºËÜÕËáµÄ²ôÈëÀ´È·¶¨ DNA ÐòÁС£´«Í³ PacBio ²âÐòԭʼ¶Á³¤´íÎóÂʽϸߣ¬Circular Consensus Sequencing£¨CCS£©²ßÂÔ¿ÉÌá¸ß²âÐò׼ȷÐÔ£¬²úÉú¸ß±£Õ棨HiFi£©¶Á³¤£¬´íÎóÂʵÍÓÚ 0.1%¡£PacBio ÓÐ HiFi Express Template Prep Kit 2.0 ºÍ SMRTbell Prep Kit 3.0 µÈÊÔ¼ÁºÐ£¬¿ÉÓÃÓÚ±ê×¼ºÍµÍ DNA ÊäÈëЭÒ飬µÍÊäÈëЭÒéÊÊÓÃÓÚСÉúÎï»ùÒò×é²âÐò£¬ÉõÖÁ¿É´Ó¼«ÉÙÁ¿ DNA ÖÆ±¸ÎĿ⡣
    • ͨ¹ý¶îÍⳤ³ÌÐÅÏ¢¸Ä½ø×é×°£º³õʼ³¤¶Á³¤×é×°µÄ contigs ÊýÁ¿Í¨³£¶àÓÚȾɫÌåÊýÁ¿£¬¿ÉÀûÓöîÍâµÄÐòÁÐÐÅÏ¢½øÐÐÖ§¼Ü¹¹½¨£¬Ìá¸ß×é×°ÖÊÁ¿¡£Hi - C ¼¼Êõͨ¹ý½»ÁªÈ¾É«ÖÊÇøÓò²¢²âÐò£¬¸ù¾ÝȾɫÖÊÏ໥×÷ÓÃģʽ½« contigs ÅÅÐòºÍ¶¨Ïò£¬´Ó¶øÊµÏÖȾɫÌåˮƽµÄ×é×°¡£¹âѧӳÉäÊÇÁíÒ»ÖÖÖ§¼Ü¹¹½¨·½·¨£¬µ«Òò¼¼ÊõÄѶȽϸߣ¬²»Èç Hi - C ³£Óá£TELL seq Ôòͨ¹ýÉú³ÉÌõÐÎÂëÁ¬½ÓµÄ¶Ì¶Á³¤£¬×é×°³ÉÈ˹¤³¤¶Á³¤£¬¿ÉÓÃÓÚС¸öÌå»òС×éÖ¯Ñù±¾µÄ²âÐòºÍµ¥±¶ÐÍ phasing¡£
    • RNAseq ¸¨Öú»ùÒò×é×¢ÊÍ£ºRNAseq Êý¾Ý¿ÉÌṩ»ùÒò×é±àÂ벿·ÖµÄÐÅÏ¢£¬°ïÖúѵÁ·»ùÒòÔ¤²â¹¤¾ß£¬Ìá¸ß»ùÒò×¢ÊÍ׼ȷÐÔ¡£³£¹æ RNA - Seq ·ÖÎö¶Ì¶Á³¤ cDNA Ƭ¶Î£¬µ«ÓÉÓڿɱä¼ô½ÓµÄ¸´ÔÓÐÔ£¬×ªÂ¼±¾ÍƶϿÉÄܲ»×¼È·¡£³¤¶Á³¤²âÐò·½·¨£¬Èç ONT ºÍ PacBio Isoform Sequencing£¨Iso - Seq£©£¬¿É»ñµÃÈ«³¤×ªÂ¼±¾ÐòÁУ¬Ìá¸ß×¢ÊÍÖÊÁ¿¡£Iso - Seq ¿ÉÉú³ÉÈ«³¤ cDNA ÐòÁУ¬PacBio Kinnex kit ÊÇ Iso - Seq µÄ½øÒ»²½·¢Õ¹£¬¿ÉÌá¸ßͨÁ¿¡£
  4. ÖÊÁ¿ÐÞ¼ô£¨phase 4£©
    • ONT ¼î»ùʶ±ðºÍÖÊÁ¿¼ì²é£ºONT ²âÐòԭʼÊý¾Ý´æ´¢Îª pod5£¨ÒÔǰΪ fast5£©¸ñʽ£¬Ðèת»»Îª fastq ¸ñʽ½øÐмî»ùʶ±ð¡£¼î»ùʶ±ðÈí¼þ²»¶Ï¸üУ¬½¨Ò鼰ʱ¸üв¢³¢ÊÔÐÂÈí¼þ¡£FastQC ¿ÉÓÃÓÚÒ»°ãÊý¾ÝÖÊÁ¿¼ì²é£¬PycoQC ºÍ MinIONQC רΪ ONT Êý¾ÝÉè¼Æ£¬¿É·ÖÎö¶Á³¤¡¢ÊýÁ¿ºÍÖÊÁ¿·Ö²¼¡£¶Á³¤¹ýÂË¡¢ÖÊÁ¿ÐÞ¼ôºÍ½ÓÍ·È¥³ý¿ÉʹÓà pychopper¡¢porechop_ABI ºÍ nanofilt µÈ¹¤¾ß£¬µ« ONT Êý¾ÝÖÊÁ¿·ÖÊýÏà¶Ô½ÏµÍ£¬¹ýÂËʱÐè½÷É÷£¬±ÜÃⶪʧ¹ý¶àÊý¾Ý¡£
    • PacBio HiFi ¼î»ùʶ±ð¡¢Ô¤´¦ÀíºÍÖÊÁ¿¼ì²é£ºPacBio ÔÚ CCS ģʽϲâÐòÓÐÁ½ÖÖ»ñÈ¡ HiFi ¶Á³¤µÄ·½Ê½£¬¼´°åÔØµ÷ÓúͺóÐø´Ó×Ó¶Á³¤Éú³É HiFi ¶Á³¤¡£°åÔØµ÷ÓÃËä¼õÉÙÊý¾Ý´«ÊäÁ¿£¬µ«»á¶ªÊ§×Ó¶Á³¤£¬ÇÒijЩ¹¤¾ß²»Èç DeepConsensus¡£DeepConsensus ¹ÜµÀ¼ÆËãÒªÇó½Ï¸ß£¬µ«¿É»ñµÃ¸ü¶àÊý¾Ý¡£ÔÚÔËÐÐ×éװǰ£¬ÐèÆÀ¹À HiFi ¶Á³¤µÄ×ܳ¤¶È¡¢³¤¶È·Ö²¼ºÍÀíÂÛ¸²¸Ç¶È£¬ÒÔÅжÏ×é×°µÄ¿ÉÐÐÐÔ¡£
  5. »ùÒò×é×é×°£¨phase 5£©
    • ×é×°¹¤¾ßÑ¡Ôñ£ºÓжàÖÖ¹¤¾ß¿ÉÓÃÓÚ PacBio HiFi Êý¾Ý×é×°£¬hifiasm ͨ³£ÔÚËÙ¶È¡¢Á¬ÐøÐÔºÍ׼ȷÐÔ·½Ãæ±íÏÖ×î¼Ñ¡£¶ÔÓÚÒ׳ö´íµÄ ONT Êý¾Ý£¬Ò²ÓÐÐí¶à×é×°¹¤¾ß¿É¹©Ñ¡Ôñ£¬Èç Canu¡¢Racon¡¢Flye µÈ¡£²»Í¬¹¤¾ßÔÚ¼ÆËã×ÊÔ´ÐèÇóºÍ׼ȷÐÔÉÏÓÐËù²îÒ죬Flye ÔÚ´¦Àí ONT Êý¾Ýʱ±íÏֽϺã¬hifiasm ×Ô 0.21 °æ±¾ÆðÒ²ÄܽϺõش¦Àí ONT Êý¾Ý¡£
    • ÎÛȾ¼ì²é£ºÑù±¾ÖпÉÄÜ´æÔÚÆäËûÉúÎïµÄÎÛȾ£¬Èçϸ°ûÄÚ¼ÄÉú³æ¡¢¹²ÉúÌå»ò³¦µÀÄÚÈÝÎïµÈ¡£ÕâЩÎÛȾ¿ÉÄܵ¼Ö´íÎóµÄ»ùÒò×¢ÊͺÍˮƽ»ùÒò×ªÒÆµÄ´íÎóÅжϡ£¿ÉʹÓà NCBI Foreign contamination screen¡¢FCS - GX ºÍ blobtools µÈ¹¤¾ß½øÐÐÎÛȾ¼ì²âºÍÈ¥³ý¡£FCS - GX »ùÓÚÐòÁÐÏàËÆÐÔʶ±ðÎÛȾ£¬µ«Êý¾Ý¿â¿ÉÄܲ»ÍêÕû£»blobtools ͨ¹ý¾ÛÀà contigs ºÍ / »ò scaffolds£¬¸ù¾Ý¶Á³¤¸²¸Ç¶ÈºÍ GC º¬Á¿Ê¶±ðÎÛȾ£¬Ê¹ÓÃʱÐè×¢ÒâÆä¼ÙÉèÌõ¼þ£¬ÈçÎÛȾÓëÄ¿±êÎïÖÖµÄ GC º¬Á¿²îÒ죬ÇÒ½¨Òé½áºÏÊÖ¶¯É¸Ñ¡£¬±ÜÃâÎóÅС£
    • Hi - C Êý¾ÝÖ§¼Ü¹¹½¨£ºHi - C Êý¾Ý¿ÉÓÃÓÚÈ·¶¨ contigs µÄ˳ÐòºÍ·½Ïò£¬ÊµÏÖȾɫÌåˮƽµÄ×é×°¡£ÔÚ½øÐÐ Hi - C ÎÄ¿âÖÆ±¸Ê±£¬Èôµ¥¸öÑù±¾ÎÞ·¨Ìṩ×ã¹»µÄ HMW DNA£¬¿É¿¼ÂÇ»ìºÏÑù±¾£¬µ«ÐèÈ·±£Ó³ÉäÎÞÆ«²îÇÒºËÐÍÏàͬ¡£Hi - C ÎÄ¿âÖÆ±¸ÄѶȽϴ󣬿ÉʹÓà qc3C ¹¤¾ß½øÐÐÖÊÁ¿¼ì²é¡£Hi - C ¶Á³¤ÐèÓ³Éäµ½ contigs ÉÏ£¬¿ÉʹÓà bwa mem¡¢chromap µÈ¹¤¾ß£¬YaHS ÊÇĿǰÓÃÓÚÖ§¼Ü¹¹½¨µÄ¿ìËÙÇÒ׼ȷµÄ¹¤¾ßÖ®Ò»¡£Hi - C Êý¾Ý¿ÉÊÓ»¯»ùÓÚ½Ó´¥Í¼£¬¿É°ïÖúÅжÏ×é×°µÄ׼ȷÐÔ£¬ÔÚÅжÏȾɫÌå±Û·½Ïò²»Ã÷ȷʱ£¬¼ì²â¶ËÁ£Öظ´ÐòÁпÉÌṩ°ïÖú¡£Ëæ×Å phased assemblies µÄ·¢Õ¹£¬Ë«±à¼­£¨dual curation£©¼¼Êõ¿ÉÓÃÓÚ¼ì²éºÍ¾ÀÕýµ¥±¶ÐÍ·ÖÅä´íÎó¡£
    • ×é×°Á¬ÐøÐÔÆÀ¹À£ºN50 Êdz£ÓÃµÄÆÀ¹À×é×°Á¬ÐøÐÔµÄÖ¸±ê£¬Ëü±íʾ 50% µÄ×é×°×ܳ¤¶ÈËùÔÚµÄÐòÁг¤¶È¡£NG50 Ôò¿¼ÂÇÁ˹À¼ÆµÄ»ùÒò×é´óС£¬¸üÊʺϱȽϲ»Í¬ÎïÖÖµÄ×é×°½á¹û¡£´ËÍ⣬L50 ºÍ LG50 µÈÖ¸±ê¿É·´Ó³´ïµ½Ò»¶¨±ÈÀý×é×°³¤¶ÈËùÐèµÄÐòÁÐÊýÁ¿¡£QUAST/QUAST - LG µÈ¹¤¾ß¿ÉÉú³ÉÕâЩָ±ê£¬²¢Óë²Î¿¼»ùÒò×é½øÐбȽϣ¬ÆÀ¹À×é×°ÖÊÁ¿¡£
    • ×é×°ÍêÕûÐÔÆÀ¹À£º±È½Ï×é×°×ܳ¤¶ÈÓë¹À¼Æ»ùÒò×é´óС¿ÉÆÀ¹À×é×°ÍêÕûÐÔ¡£Ò²¿Éͨ¹ý½«Ô­Ê¼ÐòÁÐÊý¾ÝÓ³Éäµ½×é×°ÉÏ£¬¼ÆËã k - mer ÍêÕûÐԺʹíÎóÂÊ£¨ÈçʹÓà Meryl ºÍ Merqury ¹¤¾ß£©£¬»òͨ¹ýÓ³Éä¶Á³¤µÄ¸²¸Ç¶È·Ö²¼À´ÆÀ¹À¡£Benchmarking universal single - copy orthologs£¨BUSCO£©·ÖÎöͨ¹ý¼ì²âµ¥¿½±´Ö±ÏµÍ¬Ô´»ùÒòµÄ»Ö¸´Çé¿öÀ´ÆÀ¹À×é×°ÖÊÁ¿£¬BUSCO ÌṩÁ˶à¸ö·ÖÀàȺµÄֱϵͬԴ»ùÒò¼¯£¬µ«Ê¹ÓÃʱÐè×¢ÒâÆä´ú±íÐÔ¡£compleasm ÊÇ BUSCO µÄÖØÐÂʵÏÖ£¬ÔËÐÐʱ¼ä¸ü¶Ì¡¢×¼È·ÐÔ¸ü¸ß£¬½¨ÒéͬʱʹÓöþÕß½øÐбȽϡ£
    • haplotig Çå³ýºÍ phased assemblies£ºÔڸ߸²¸Ç¶ÈºÍ¸ßÔÓºÏÐÔÇé¿öÏ£¬×é×°¹¤¾ß¿ÉÄܲúÉú haplotigs£¬Ó°Ïì×¢ÊͺͺóÐø·ÖÎö¡£¿ÉʹÓà redundans¡¢purge_haplotigs µÈ¹¤¾ßÇå³ý haplotigs »òÈÚºÏÖØ¸´ÐòÁС£Ô½À´Ô½¶àµÄÑо¿ÐèÒª phased assemblies£¬¼´Í¬Ê±°üº¬Á½¸öͬԴȾɫÌ弯µÄ×é×°£¬ÕâÓÐÖúÓÚ¸ü׼ȷµØÑо¿»ùÒò×é½á¹¹ºÍ¹¦ÄÜ¡£
  6. ÖØ¸´ÐòÁк͵°°×ÖʱàÂë»ùÒòµÄ×¢ÊÍ£¨phase 6£©
    • ½á¹¹×¢ÊÍ£º½á¹¹×¢ÊÍÖ÷Òª°üÀ¨Ê¶±ðÖØ¸´Ôª¼þºÍµ°°×ÖʱàÂëÇøÓò¡£×ª×ùÔª¼þ£¨TE£©»á¸ÉÈŵ°°×ÖÊÔ¤²â£¬Òò´ËÐèÏÈʶ±ð²¢ÆÁ±Î TE ºÍÆäËûÖØ¸´Ôª¼þ£¬³£Óù¤¾ßÈç Repeatmasker/Repeatmodeler¡£RepeatModeler ¿É¹¹½¨Öظ´ÎĿ⣬µ«»á²úÉúÈßÓàÐÅÏ¢ºÍ¼ÙÑôÐÔ½á¹û£¬Ðè½øÒ»²½ÊÖ¶¯»ò°ë×Ô¶¯É¸Ñ¡¡£»ùÒò×¢ÊÍ·½·¨·ÖΪ´ÓÍ·Ô¤²âºÍ»ùÓÚÖ¤¾ÝµÄ·½·¨£¬Í¨³£½áºÏʹÓÃÒÔÌá¸ß׼ȷÐÔ¡£RNAseq Êý¾Ý¿ÉÌṩת¼֤¾Ý£¬Ö§³Ö»ùÒò±ß½çµÄ¾«È·¼ì²â¡£
    • µ°°×ÖʱàÂë»ùÒò×¢ÊÍ£ºµ°°×ÖʱàÂë»ùÒò×¢ÊÍ¿ÉʹÓà Augustus¡¢Braker µÈ¹¤¾ß£¬Funannotate ÊÊÓÃÓÚ¶àÖÖÕæºËÉúÎï»ùÒò×é×¢ÊÍ¡£»¹ÓлùÓÚ»úÆ÷ѧϰµÄ·½·¨ÓÃÓÚ»ùÒò½á¹¹×¢ÊÍ¡£±È½Ï×¢Ê͹¤¾ß¿ÉÀûÓÃÏà¹ØÎïÖֵĻùÒò×é×¢ÊÍÐÅÏ¢¸¨Öú×¢ÊÍ¡£
    • ¹¦ÄÜ×¢ÊÍ£º¹¦ÄÜ×¢Ê͸³Óèµ°°×ÖÊÐòÁÐÌØ¶¨ÌØÕ÷£¬Èç»ùÒò±¾Ì壨GO£©ÊõÓï¡¢´úл;¾¶£¨È義¶¼»ùÒòÓë»ùÒò×é°Ù¿ÆÈ«Êé KEGG£©¡¢³¬¼Ò×åÐÅÏ¢µÈ¡£¿ÉʹÓà InterProScan¡¢eggNOG - mapper µÈ¹¤¾ß½øÐй¦ÄÜ×¢ÊÍ£¬µ«¶ÔÓÚ·ÇģʽÉúÎÓÉÓÚÊý¾Ý¿âÐÅÏ¢²»×㣬עÊÍÄѶȽϴó¡£
  7. Êý¾Ý¹«¿ª£ºÎªÊ¹Ñо¿Êý¾ÝºÍ½á¹û¿É±»¿ÆÑ§½çʹÓã¬×÷ÕßÓ¦×ñÑ­ FAIR Ô­Ôò£¬½«Ô­Ê¼²âÐòÊý¾Ý¡¢×é×°ºÍ×¢ÊÍÉÏ´«ÖÁ¹ú¼ÊºËÜÕËáÐòÁÐÊý¾Ý¿âЭ×÷×éÖ¯£¨INSDC£©µÄ³ÉÔ±Êý¾Ý¿â£¬Èç RIOS - NIG¡¢EMBL - EBI »ò NLM - NCBI¡£Í¬Ê±£¬½¨Òé·¢±íͬÐÐÆÀÉóµÄÎÄÕ£¬ÏêϸÃèÊöʵÑéºÍ·ÖÎö¹ý³Ì£¬È·±£Ñо¿µÄ¿ÉÖØ¸´ÐÔ¡£

½áÂÛÓëÕ¹Íû

¾¡¹ÜÏÖ´ú²âÐò¼¼Êõ²»¶Ï½ø²½£¬µ«ÈÔÎÞ·¨ÍêÈ«¾«È·²â¶¨ÕûÌõȾɫÌåµÄÐòÁС£Ä¿Ç°µÄ²âÐò·½·¨ËäÄÜ»ñÈ¡´óÁ¿»ùÒò×éÐÅÏ¢£¬µ«»ùÒò×é×é×°ºÍ×¢ÊÍÈÔÃæÁÙÌôÕ½¡£Ëæ×ÅÈ«Çò»ùÒò×鼯»®µÄÍÆ½ø£¬Ô¤¼Æ½«³öÏÖ¸üºÃµÄ»ùÒò×é×é×°ºÍ×¢Êͱê×¼¡£»úÆ÷ѧϰÓÐÍû¸ÄÉÆ»ùÒò×é×¢Ê͵ÄÏÖ×´£¬±È½Ï»ùÒò×éѧ½«¸ü¹Ø×¢½á¹¹±äÒì¡¢¿½±´Êý±äÒì¡¢·Ç±àÂëÔª¼þºÍÖØ¸´Ôª¼þ¶ÔÉúÎï½ø»¯µÄÓ°Ï졣ȷ±£»ùÒò×é×é×°ºÍ×¢Ê͵ĿÉÖØ¸´ÐÔ£¬¹«¿ªËùÓзÖÎö²ÎÊýºÍ½Å±¾£¬½«ÓÐÖúÓÚÍÆ¶¯»ùÒò×éѧÑо¿µÄ·¢Õ¹¡£
Ïà¹ØÐÂÎÅ
ÉúÎïͨ΢ÐŹ«ÖÚºÅ
΢ÐÅ
ÐÂÀË΢²©
  • ¼±Æ¸Ö°Î»
  • ¸ßнְλ

ÖªÃûÆóÒµÕÐÆ¸

ÈȵãÅÅÐÐ

    ½ñÈÕ¶¯Ì¬ | È˲ÅÊг¡ | м¼ÊõרÀ¸ | Öйú¿ÆÑ§ÈË | ÔÆÕ¹Ì¨ | BioHot | ÔÆ½²ÌÃÖ±²¥ | »áÕ¹ÖÐÐÄ | ÌØ¼ÛרÀ¸ | ¼¼Êõ¿ìѶ | Ãâ·ÑÊÔÓÃ

    °æÈ¨ËùÓÐ ÉúÎïͨ

    Copyright© eBiotrade.com, All Rights Reserved

    ÁªÏµÐÅÏ䣺

    ÔÁICP±¸09063491ºÅ