NVIDIA Ekibi Öneri Sistemlerinde Kupayı Aldı

NVIDIA Ekibi Öneri Sistemlerinde Kupayı Aldı


Beş kişilik harika bir NVIDIA ekibi makine öğrenme dört kıtaya dağılmış uzmanlar, en son teknolojiyi oluşturmak için hararetli çekişmeli, prestijli bir yarışmada üç görevi de kazandı. öneri sistemleri.

Sonuçlar, grubun NVIDIA AI platformunu dijital ekonominin bu motorları için gerçek dünyadaki zorluklara uygulamadaki ustalığını yansıtıyor. Tavsiyeciler, her gün milyarlarca insana trilyonlarca arama sonucu, reklam, ürün, müzik ve haber sunar.

450’den fazla veri bilimcisi ekibi yarıştı. Amazon KDD Kupası ’23. Üç aylık mücadelenin kendi payına düşen kıvrımları ve dönüşleri ve tırnak ısırtan bir bitişi vardı.

Yüksek Vitese Geçmek

Karşılaşmanın ilk 10 haftasında takım rahat bir üstünlük sağladı. Ancak son aşamada organizatörler yeni test veri kümelerine geçti ve diğer ekipler hızla öne geçti.

NVIDIAN’ler yetişmek için yüksek vitese geçti, geceleri ve hafta sonları çalıştı. Berlin’den Tokyo’ya kadar şehirlerde yaşayan ekip üyelerinden gece gündüz Slack mesajları bıraktılar.

San Diego’daki bir ekip üyesi olan Chris Deotte, “Durmadan çalışıyorduk, oldukça heyecan vericiydi” dedi.

Başka İsimde Bir Ürün

Üç görevden sonuncusu en zoruydu.

Katılımcılar, göz atma oturumlarından elde edilen verilere dayanarak kullanıcıların hangi ürünleri satın alacağını tahmin etmek zorunda kaldı. Ancak eğitim verileri, birçok olası seçeneğin marka adlarını içermiyordu.

Gilberto “Giba” Titericz, “Başından beri bunun çok çok zor bir test olacağını biliyordum” dedi.

Kurtarmak için KGMON

Merkezi Brezilya, Curitaba’da bulunan Titericz, çevrimiçi veri bilimi Olimpiyatları olan Kaggle yarışmalarında büyükusta olarak derecelendirilen dört ekip üyesinden biriydi. Düzinelerce yarışma kazanmış makine öğrenimi ninjalarından oluşan bir ekibin parçasılar. NVIDIA’nın kurucusu ve CEO’su Jensen Huang, onlara KGMON (NVIDIA’nın Kaggle Büyük Ustaları), Pokémon’da eğlenceli bir kalkış.

Düzinelerce deneyde Titericz, büyük dil modelleri kullandı (LLM’ler) inşa etmek üretken yapay zekalar ürün adlarını tahmin etmek için, ancak hiçbiri işe yaramadı.

Yaratıcı bir flaşla, ekip bir geçici çözüm keşfetti. Yeni hibrit sıralama/sınıflandırıcı modellerini kullanan tahminler isabetliydi.

tele kadar

Yarışmanın son saatlerinde ekip, son birkaç sunum için tüm modellerini bir araya getirmek için yarıştı. Bir gecede 40 kadar bilgisayarda deneyler yürütüyorlardı.

Tokyo’da bir KGMON olan Kazuki Onodera gergin hissediyordu. “Gerçek puanlarımızın tahmin ettiğimizle eşleşip eşleşmeyeceğini gerçekten bilmiyordum” dedi.

KGMON resimleri
Dört KGMON (sol üstten saat yönünde) Onodera, Titericz, Deotte ve Puget.

Aynı zamanda bir KGMON olan Deotte, bunu “tek bir çıktı üretmek için birlikte çalışan 100 farklı model gibi bir şey … bunu skor tablosuna ve POW’a sunduk!”

Ekip, bir fotoğraf bitişinin yapay zeka eşdeğerinde en yakın rakibinin önüne geçti.

Transfer Öğrenmenin Gücü

Başka bir görevde, ekibin İngilizce, Almanca ve Japonca dillerindeki büyük veri kümelerinden öğrenilen dersleri alması ve bunları Fransızca, İtalyanca ve İspanyolca dillerindeki onda biri büyüklüğündeki yetersiz veri kümelerine uygulaması gerekiyordu. Bu, birçok şirketin dijital varlıklarını dünya çapında genişletirken karşılaştıkları türden gerçek dünya sorunudur.

Paris dışında yerleşik üç kez Kaggle büyük ustası olan Jean-Francois Puget, öğrenmeyi aktarmak için etkili bir yaklaşım biliyordu. Ürün adlarını kodlamak için önceden eğitilmiş çok dilli bir model kullandı, ardından kodlamalarda ince ayar yaptı.

“Transfer öğrenimini kullanmak, liderlik tablosu puanlarını büyük ölçüde iyileştirdi” dedi.

Bilgili ve Akıllı Yazılımı Harmanlamak

KGMON çabaları, recsys olarak bilinen alanın bazen bilimden çok sanat olduğunu, sezgi ve yinelemeyi birleştiren bir uygulama olduğunu gösteriyor.

Gibi yazılım ürünlerine kodlanmış uzmanlıktır. NVIDIA Merlinkullanıcıların kendi öneri sistemlerini hızlı bir şekilde oluşturmalarına yardımcı olan bir çerçeve.

Tavsiye için Merlin çerçevesi şeması
Merlin çerçevesi, öneri sistemleri oluşturmak için uçtan uca bir çözüm sunar.

Merlin’in tasarımına yardımcı olan, Berlin merkezli bir ekip arkadaşı olan Benedikt Schifferer, rekabetin klasik recsys görevini alt üst eden transformatör modellerini eğitmek için yazılımı kullandı.

“Merlin, kutudan çıkar çıkmaz harika sonuçlar sağlıyor ve esnek tasarım, modelleri belirli bir zorluk için özelleştirmeme izin veriyor” dedi.

Rapids’e binmek

Takım arkadaşları gibi o da kullandı. HIZLILARGPU’larda veri bilimini hızlandırmak için bir dizi açık kaynaklı kitaplık.

Örneğin, Deotte koda şu adresten erişti: NGC, NVIDIA’nın hızlandırılmış yazılım merkezi. DASK XGBoost adlı kod, büyük, karmaşık bir görevin sekiz GPU’ya ve bunların belleğine yayılmasına yardımcı oldu.

Titericz ise, milyonlarca ürün karşılaştırmasını saniyeler içinde aramak için cuML adlı bir RAPIDS kitaplığı kullandı.

Ekip odaklandı oturuma dayalı öneriler birden fazla kullanıcı ziyaretinden veri gerektirmeyen. Birçok kullanıcının gizliliğini korumak istediği günümüzde en iyi uygulamadır.

Daha fazla öğrenmek için:


Kaynak : https://blogs.nvidia.com/blog/2023/07/12/recommendation-systems-win/

Bir yanıt yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

SMM Panel PDF Kitap indir