Yapay Zeka Genomikleri Nasıl Dönüştürüyor?

Yapay Zeka Genomikleri Nasıl Dönüştürüyor?


Tüm genom dizilemesindeki gelişmeler, dijital biyolojide bir devrimi ateşledi.

Yüksek verimli, yeni nesil dizilemenin maliyeti düştükçe dünya çapındaki genom bilimi programları ivme kazanıyor.

İster nadir hastalıkları olan yoğun bakım hastalarının dizilimi için ister popülasyon ölçekli genetik araştırmalarında kullanılsın, tüm genom dizilimi klinik iş akışlarında ve ilaç keşfinde temel bir adım haline geliyor.

Ancak genom dizilimi sadece ilk adımdır. Genom dizileme verilerini analiz etmek, genomu okumak ve anlamak için hızlandırılmış bilgi işlem, veri bilimi ve yapay zeka gerektirir. İle Moore yasasının sonubir entegre devredeki transistör sayısının her iki yılda bir ikiye katlandığı gözlemi, veri analizinin maliyetini düşürmek, okumaların verimini ve doğruluğunu artırmak ve nihayetinde insanın tam potansiyelini ortaya çıkarmak için yeni bilgi işlem yaklaşımları gereklidir. genetik şifre.

bir patlama biyoinformatik Veri

Bir bireyin tüm genomunun dizilenmesi kabaca 100 gigabayt ham veri üretir. Genom, derin öğrenme ve doğal dil işleme gibi karmaşık algoritmalar ve uygulamalar kullanılarak sıralandıktan sonra iki kattan fazla artıyor.

Bir insan genomunu dizilemenin maliyeti azalmaya devam ettikçe, dizileme verilerinin hacmi katlanarak artıyor.

Tahminen 40 exabyte 2025 yılına kadar tüm insan genomu verilerini depolaması gerekecek. Referans olarak, bu, tarihte konuşulan her kelimeyi depolamak için gerekenden 8 kat daha fazla depolama anlamına geliyor.

Birçok genom analizi boru hattı, yetişmek için mücadele geniş ham veri seviyeleri üretiliyor.

Yapay Zeka Genomikleri Nasıl Dönüştürüyor?

hızlandırılmış Genom Dizileme Analizi iş akışları

Sıralama analizi, bir insan genomundaki genetik varyantları tanımlamak için gereken çok sayıda adımla karmaşık ve hesaplama açısından yoğundur.

Derin öğrenme, RNN ve evrişimli sinir ağı (CNN) tabanlı modeller kullanılarak doğrudan genomik enstrüman içinde temel arama için önemli hale geliyor. Sinir ağları, enstrümanlar tarafından üretilen görüntü ve sinyal verilerini yorumlar ve insan genomunun 3 milyar nükleotit çiftini çıkarır. Bu, okumaların doğruluğunu artırıyor ve temel aramanın gerçek zamana daha yakın gerçekleşmesini sağlayarak, numuneden varyant çağrı formatına ve nihai rapora kadar tüm genomik iş akışını daha da hızlandırıyor.

İkincil genomik analiz için, hizalama teknolojileri, DNA fragmanlarının dizilenmesinden sonra bir genomu tekrar bir araya getirmeye yardımcı olmak için bir referans genom kullanır.

BWA-MEMHizalama için önde gelen bir algoritma olan , araştırmacıların DNA dizi okumalarını hızlı bir şekilde bir referans genoma eşlemesine yardımcı oluyor. YILDIZ gen ifadelerini daha iyi anlamak için doğru, ultra hızlı hizalama sağlayan RNA-seq verileri için kullanılan başka bir altın standart hizalama algoritmasıdır.

Dinamik programlama algoritması Smith-Waterman, hizalama için de yaygın olarak kullanılır; NVIDIA H100 Tensör Çekirdekli GPUdinamik bir programlama hızlandırıcı içerir.

ortaya çıkarmak Genetik Varyantlar

Sıralama projelerinin en kritik aşamalarından biri, araştırmacıların bir hastanın numunesi ile referans genomu arasındaki farkları tanımladığı varyant çağırmadır. Bu, klinisyenlerin kritik derecede hasta bir hastada hangi genetik hastalığa sahip olabileceğini belirlemesine veya araştırmacıların yeni ilaç hedefleri keşfetmek için bir popülasyona bakmasına yardımcı olur. Bu varyantlar, tek nükleotitli değişiklikler, küçük eklemeler ve silmeler veya karmaşık yeniden düzenlemeler olabilir.

GPU için optimize edilmiş ve hızlandırılmış arayanlar, örneğin Geniş Enstitüsü’nün GATK — eşey hattı varyantı çağırmak için bir genom analizi araç seti — analiz hızını artırın. Araştırmacıların GATK sonuçlarındaki yanlış pozitifleri ortadan kaldırmasına yardımcı olmak için NVIDIA, Broad Institute ile iş birliği yaptı. NVScoreVaryantlarıCNN’leri kullanarak değişkenleri filtrelemek için derin bir öğrenme aracı.

Google’ınkiler gibi derin öğrenme tabanlı değişken arayanlar Derin Varyant Ayrı bir filtreleme adımına ihtiyaç duymadan aramaların doğruluğunu artırın. DeepVariant, değişkenleri çağırmak için bir CNN mimarisi kullanır. Her genomik platformun çıktıları ile gelişmiş doğruluk için ince ayar yapmak üzere yeniden eğitilebilir.

İkincil analiz yazılımı NVIDIA Clara Parabricks araç paketi bu değişken arayanları hızlandırdı 80x’e kadar. Örneğin, germline HaplotypeCaller’ın çalışma süresi, CPU tabanlı bir ortamda 16 saatten GPU hızlandırmalı Clara Parabricks ile beş dakikanın altına düşürüldü.

Bir Sonraki Genomik Dalgasını Hızlandırmak

NVIDIA, hem kısa hem de uzun okumalı sıralama platformlarını hızlandırılmış yapay zeka tabanlı arama ve değişken arama ile güçlendirerek bir sonraki genom bilimi dalgasını etkinleştirmeye yardımcı oluyor. Endüstri liderleri ve startup’lar, tüm genom dizilemenin sınırlarını zorlamak için NVIDIA ile birlikte çalışıyor.

Örneğin, biyoteknoloji şirketi PacBio yakın zamanda duyurdu Revio sistem, NVIDIA Tensor Core GPU’ları içeren yeni bir uzun okuma sıralama sistemi. Önceki sistemlere göre bilgi işlem gücünde 20 kat artış sağlayan Revio, insan genomlarını 1.000 doların altındaki ölçekte yüksek doğrulukta uzun okumalarla sıralamak için tasarlanmıştır.

Oxford Nanopore Teknolojileri herhangi bir uzunluktaki DNA veya RNA fragmanlarını gerçek zamanlı olarak sıralayabilen tek teknolojiyi sunar. Bu özellikler, daha fazla genetik varyasyonun hızlı bir şekilde keşfedilmesini sağlar. Seattle Çocuk Hastanesi, yeni doğmuş bir bebeğin yaşamının ilk birkaç saatindeki genetik bir bozukluğu anlamak için kısa süre önce yüksek verimli nano gözenek sıralama aracı PromethION’u kullandı.

Ultima Genomik numune başına yalnızca 100 ABD Doları karşılığında yüksek verimli tam genom dizileme sunuyor ve Tekil GenomikG4, en güçlü tezgah üstü sistemdir.

Daha fazla bilgi edin

-de NVIDIA GTC20-23 Mart tarihlerinde çevrimiçi olarak gerçekleşecek ücretsiz bir AI konferansında, PacBio, Oxford Nanopore, Genomic England, KAUST, Stanford, Argonne National Labs ve diğer önde gelen kurumlardan konuşmacılar genomik dizilemede en son yapay zeka gelişmelerianaliz ve gen ifadesini anlamak için genomik büyük dil modelleri.

konferans özellikleri bir NVIDIA kurucusu ve CEO’su Jensen Huang’dan açılış konuşması 21 Mart Salı sabah 8’de PT.

NVIDIA Clara Parabricks öğrenciler ve araştırmacılar için ücretsizdir. Bu gün başlayacağım veya ücretsiz bir uygulamalı laboratuvarı deneyin araç setini çalışırken deneyimlemek için.


Kaynak : https://blogs.nvidia.com/blog/2023/02/24/how-ai-is-transforming-genomics/

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

SMM Panel PDF Kitap indir