ChatGPT ve diğer üretken YZ modelleri son zamanlarda popülerlik kazanıyor, ancak bunları kullanmanın maliyeti çok yüksek olabilir. Bu, küçük bir girişim olan Latitude'un, kullanıcı girişine dayalı olarak fantastik hikayeler üreten YZ zindan oyunuyla popülaritesini artırmasıyla netleşti. CEO Nick Walton, metne dayalı rol yapma oyunu yazılımının bakım maliyetinin, oyunu daha fazla kullanıcı oynadıkça artmaya devam ettiğini keşfetti. YZ Dungeon'ın metin üretimi, Microsoft'un OpenAI tarafından geliştirilen GPT dil teknolojisine dayanıyordu. Ek olarak, içerik pazarlamacıları oyunu reklam metni oluşturmak için kullandı ve bu da Latitude'un YZ faturasını etkiledi.
Walton'a göre 2021'de şirket, her gün işlemek zorunda olduğu milyonlarca kullanıcı isteğine ayak uydurmak için OpenAI ve Amazon Web Services üretken yapay zeka yazılımına ayda yaklaşık 200.000 dolar harcıyordu. Walton, "İnsan işçilerimiz ve yapay zeka çalışanlarımız olduğu konusunda şaka yaptık ve her biri için yaklaşık aynı parayı harcadık" dedi. "Yapay zekaya her ay yüz binlerce dolar harcadık ve büyük bir girişim değiliz, bu yüzden çok yüksek bir maliyetti."
2021'in sonlarında, maliyetleri azaltmak için Latitude, AI21 Labs'tan daha ucuz ancak yine de yetenekli bir dil yazılımına geçti. Ayrıca şirket, ücretsiz açık kaynak dil modellerini hizmetlerine entegre etti. Sonuç olarak şirketin aylık YZ faturaları 100.000 doların altına düştü. Latitude, maliyetleri karşılamaya yardımcı olmak için artık oyuncularından gelişmiş yapay zeka özellikleri için aylık abonelik ücreti alıyor.
Latitude'un pahalı yapay zeka faturaları, üretken yapay zeka teknolojilerini geliştirme ve sürdürme maliyetinin, hem temel teknolojileri geliştiren şirketler hem de kendi yazılımlarını çalıştırmak için yapay zekayı kullananlar için engelleyici derecede yüksek olabileceğini gösteriyor. Microsoft, Meta ve Google gibi büyük şirketler sermayelerini daha küçük rakiplerin boy ölçüşemeyeceği bir teknoloji lideri oluşturmak için kullandıklarından, bu sektör için rahatsız edici bir gerçektir. YZ uygulamalarının marjı, yüksek bilgi işlem maliyetleri nedeniyle Hizmet Olarak Yazılım (SaaS) için önceki marjdan kalıcı olarak daha düşükse, bu mevcut patlamayı azaltabilir.
Büyük dil modellerinde yüksek eğitim maliyeti ve "çıkarım" - aslında yapay zeka modellerini çalıştırıyor - önceki bilgi işlem patlamalarından farklı bir yapısal maliyettir. Yazılım bir kez oluşturulduktan veya eğitildikten sonra bile, büyük dil modellerini çalıştırmak için muazzam miktarda bilgi işlem gücü gerektirir, çünkü bir isteme yanıt verdikleri her seferde milyarlarca hesaplama gerçekleştirirler. Karşılaştırıldığında, yazılımları dağıtma ve bakımını yapma maliyeti tarihsel olarak nispeten düşük olmuştur.
Bu zorluklara rağmen, şirketlerin yeni ürünler oluşturmasına ve daha verimli çalışmasına yardımcı olabileceğinden üretken yapay zeka teknolojilerine olan talep yüksek olmaya devam ediyor. Sektör, enerji açısından daha verimli donanımlar geliştirerek ve daha az bilgi işlem gücü gerektiren yeni algoritmalar ve mimariler sunarak yapay zeka teknolojilerini kullanmanın maliyetini düşürmeye çalışıyor. Ek olarak, açık kaynak topluluğu, ücretsiz yapay zeka modelleri ve araçları sağlayarak yardımcı olabilir.
Genel olarak, YZ teknolojisi hala geliştirme aşamasındadır ve yüksek maliyet, şirketlerin ve geliştiricilerin teknolojiyi başarılı bir şekilde dağıtmak için üstesinden gelmeleri gereken bir zorluktur. Endüstri yenilik yapmaya ve daha verimli çözümler geliştirmeye devam ettikçe maliyetlerin zaman içinde düşmesi bekleniyor.
YZ Eğitim Modelleri -Eğitimin maliyeti!
Analistler ve teknoloji uzmanları, OpenAI'nin GPT-3'ü gibi büyük dil modellerini eğitmenin 4 milyon dolardan fazlaya mal olabileceğini tahmin ediyor. Yapay zeka ve makine öğrenimi konusunda uzmanlaşmış bir Forrester analisti olan Rowan Curran'a göre, daha gelişmiş modellerin eğitilmesi "tek haneli yüksek milyonlardan" daha fazlaya mal olabilir.
Meta kısa bir süre önce en büyük LLaMA modelini piyasaya sürdü ve 1.4 trilyon jetonu (kabaca 750 kelime yaklaşık 1.000 jeton) eğitmek için 2.048 Nvidia A100 GPU üzerinde eğitildi. Eğitim yaklaşık 21 gün sürdü ve yaklaşık 1 milyon GPU saati gerektirdi. AWS'ye özel fiyatlandırma ile eğitimin maliyeti 2,4 milyon doların üzerinde olacaktır. 65 milyar parametreli model, 175 milyar parametreli ChatGPT-3 gibi OpenAI'deki mevcut GPT modellerinden daha küçük olmasına rağmen, yine de pahalı bir girişimdir.
Yapay zeka girişimi Hugging Face'in CEO'su Clement Delangue'ye göre, şirketin büyük Bloom dil modelini eğitmek iki buçuk aydan fazla sürdü ve "yaklaşık 500 GPU'ya eşdeğer" bir süper bilgisayara erişim gerektirdi. Büyük dil modelleri oluşturan kuruluşların, yeteneklerini geliştirmek için modellerini yeniden eğitirken dikkatli olmaları gerektiğini çünkü bunun çok pahalı olduğunu vurguladı.
Delangue, bu modellerin her gün olduğu gibi her zaman eğitilmediğini fark etmenin önemli olduğunu belirtti. ChatGPT gibi bazı modeller en son olaylardan haberdar olmayabilir. Delangue, ChatGPT'nin bilgisinin 2021'de biteceğini de vurguladı.
Şu anda Hugging Face, Bloom'un 10 milyon dolardan fazlaya mal olmayacak ikinci versiyonu için eğitim veriyor. Ancak Delangue, her hafta bu tür antrenmanlar yapmak istemediklerini söyledi.
Çıkarım: YZ metin üreteçleri kullanılırken pahalı bir süreç.
Mühendisler, "çıkarım" sürecini kullanarak metni tahmin etmek veya oluşturmak için eğitilmiş makine öğrenimi modellerini kullanır. Bu süreç, popüler bir ürün için milyonlarca kez çalıştırılması gerekebileceğinden, modeli eğitmekten önemli ölçüde daha pahalı olabilir. Araştırmacı Curran, Ocak ayında aylık tahmini 100 milyon aktif kullanıcısı olan ChatGPT kadar popüler bir ürün için OpenAI'nin bir ay boyunca milyonlarca bilgi istemini işlemek için 40 milyon dolar harcamış olabileceğini tahmin ediyor.
Bu araçlar günde milyarlarca kez kullanıldığında maliyetler önemli ölçüde artar. Finansal analistler, OpenAI ChatGPT modeline dayanan Microsoft'un Bing YZ sohbet robotunun tüm Bing kullanıcılarına yanıtlar sunabilmesi için en az 4 milyar dolarlık altyapı gerektireceğini tahmin ediyor.
Bir OpenAI dil modeline erişen bir girişim olan Latitude, modeli eğitmek için ödeme yapmak zorunda değildi, ancak bir şirket sözcüsünün "çağrı başına yaklaşık yarım sent" olduğunu söylediği ve "birkaç" verildiği çıkarım maliyetini hesaba kattı. günde milyon istek". Curran, hesaplamalarının oldukça ihtiyatlı olduğunu tahmin ediyor.
Risk sermayedarları ve teknoloji devleri, mevcut yapay zeka patlamasını beslemek için üretken yapay zeka teknolojilerinde uzmanlaşmış yeni girişimlere milyarlarca dolar yatırım yapıyor. Örneğin, basında çıkan haberlere göre Microsoft, Ocak ayında GPT'yi denetleyen OpenAI'ye 10 milyar dolara kadar yatırım yaptı. Salesforce Ventures'ın risk sermayesi kolu, üretken YZ girişimlerini desteklemek için yakın zamanda 250 milyon dolarlık bir fon topladı.
Birçok girişimci, kontrol etmedikleri ve yalnızca kullanım başına ödeme yaptıkları, potansiyel olarak sübvansiyonlu yapay zeka modellerine güvenmenin risklerini görüyor. Beta modundaki bir sohbet robotu olan Personal.ai'nin kurucusu Suman Kanuganti, girişimcilere yalnızca OpenAI veya ChatGPT gibi büyük dil modellerine güvenmemelerini tavsiye ediyor. Kurumsal teknoloji firması Conversica gibi şirketler, Microsoft'un Azure bulut hizmeti aracılığıyla teknolojiyi daha düşük bir fiyata nasıl kullanacaklarını araştırıyorlar. Conversica CEO'su Jim Kaskade, girişimin maliyetleri hakkında yorum yapmaktan kaçındı, ancak dil modellerinin nasıl etkili bir şekilde kullanılabileceğini keşfettikleri için sübvansiyonlu maliyetlerin memnuniyetle karşılanacağını vurguladı.
Yapay Zeka Geliştirmenin Geleceği: Zorluklar ve Fırsatlar
Sektörde yapay zeka geliştirmenin maliyetinin yüksek olup olmayacağı belli değil. Temel model şirketleri, yarı iletken üreticileri ve yeni kurulan işletmelerin tümü, yapay zeka yazılımının sahip olma maliyetini düşürme konusunda iş fırsatları görüyor.
AI çip pazarının yaklaşık %95'ini elinde bulunduran Nvidia, makine öğrenimi için özel olarak tasarlanmış daha güçlü sürümler geliştirmeye devam ediyor. Ancak, sektördeki çip performansı iyileştirmeleri son yıllarda yavaşladı.
Yine de Nvidia CEO'su Jensen Huang, yapay zekanın 10 yıl içinde "bir milyon kat" daha verimli olacağına inanıyor. Sadece çipler değil, yazılım ve diğer bilgisayar bileşenleri de geliştirildi. Huang, geçen ay bir kazanç konferansında "Moore Yasası, en iyi döneminde, on yıl içinde 100 kat daha fazlasını sağlardı" dedi. "Yeni işlemciler, sistemler, ara bağlantılar, çerçeveler ve algoritmalar geliştirerek ve yeni modeller geliştirmek için veri bilimcileri ve yapay zeka araştırmacılarıyla işbirliği yaparak, büyük dil modellerinin işlenmesini milyonlarca kez hızlandırdık."
Bazı girişimler, bir iş fırsatı olarak yapay zekanın yüksek maliyetine odaklandı. D-Matrix, bilgisayarın belleğinde bir GPU'dan daha fazla işlem yaparak çıkarımdan tasarruf etmek için bir sistem geliştirdi. Kurucular, GPU'ların pahalı olduğuna ve sonuç için tasarlanmadığına inanıyor. HuggingFace'in CEO'su Delangue, büyük dil modellerine göre eğitilmesi ve çalıştırılması daha ucuz olan daha küçük, özel modellere odaklanarak daha fazla şirkete daha iyi hizmet verileceğine inanıyor.
OpenAI geçen ay GPT modellerine erişim maliyetini düşürdü. Şimdi yaklaşık 750 kelimelik bir çıktının beşte birine mal oluyor. OpenAI'nin düşük fiyatları, YZ zindan üreticisi Latitude'un dikkatini çekti. Latitude CEO'su Nick Walton, OpenAI'nin maliyetleri düşürme kararının, yapay zeka tarafından oluşturulan harika hikayelerine daha da fazla kullanıcının erişmesine olanak tanıyacağını söyledi.
Genel olarak, YZ gelişiminin geleceği, maliyet, vasıflı çalışanların mevcudiyeti, teknolojideki ilerlemeler ve düzenleyici çerçeveler dahil olmak üzere birçok faktöre bağlı olacaktır. Bununla birlikte, YZ gelişiminin önümüzdeki yıllarda birçok sektörde çok önemli bir rol oynayacağı ve bu teknolojiye erken yatırım yapan şirketlerin belirleyici bir rekabet avantajına sahip olabileceği açık.