Özetlemek gerekirse, devasa dil modellerini gerekli yönetişim mekanizmaları kurmadan kullanmak, güven, performans, yetkinlik gibi birçok alanda sorunlara yol açtı. Bu sorunları aşabilmek için KPMG olarak geliştirdiğimiz çözüm yaklaşımıza baktığımızda:
- Kurumsal kullanımda devasa çok/tek modlu dil modelleri yerine, “Baz Model” temel seviyede yetkinlik barındıran modellerin kurum verisiyle eğitilerek “Özelleştirilmiş”-Dil Modellerine çevrilmesidir. ERP verisini çok iyi öğrenmiş ERP-LM, IK verisinin çok iyi öğrenmiş IK-LM, Müşteri verisini çok iyi öğrenmiş Müşteri-LM gibi “daha az parametreli” fakat “derinleşmiş uzmanlığa” sahip “orta/küçük/mikro” dil modellerinin kullanılmasıdır.
- Özelleştirilmiş küçül dil modellerinin sadece bazı konularda uzmanlığa sahip olduğu durumda bazı taleplerin gerçekleştirilebilmesi için birden fazla özelleştirilmiş(custom)-LM’in çalışması ve sonuçları toparlayıp süzen, tek bir gerçeğe dönüştüren orkestra edici / toplayıcı dil modellerini kullanılması gereklidir.
- Gelen talebin hangi custom-LM’e gitmesi gerektiğini belirleyen “routing” yönlendirme dil modeline ihtiyaç vardır.
- Talebi yapan kullanıcı / sistemin custom-LM ekosistemindeki kapsama uygun olup olmadığı (yetkinlik dışı / güvenlik ihlali taleplerini eleyebilme) kontrolünü yapacak, kullanıcının kimlik doğrulamasını yapacak, kullanıcının talebi yapmasına ve talebin sonucunu almasına yetkisi var mı kontrollerini yapabilecek “kontrol” dil modeline ihtiyaç vardır.
- Birçok custom-small-LM’in olduğu ekosistemde veri erişimleri ve yönetiminde “veri yönetişimi” uygulamalarına ihtiyaç vardır. Bir LM’in kendine ait veri gruplarının başka bir LM tarafından erişilmesi durumunda izin verme / vermeme kararlarının doğru bir veri yönetişim yaklaşımıyla yapılabilmesi gereklidir.
- Eş zamanlı istemci ya da yoğun istemci durumlarını iyi yönetebilmek için mümkün olduğunca custom-LM’leri mikrolaştırmak ve bu sayede hem yatay hem ölçeklendirmeyi kolaylaştırabilmek, bulut bilişim ve benzeri konteyner mimarilerden faydalanabilmek gereklidir. Bir Telekom firmasından örnek vermek gerekirse gece çalışan bir yığın işin, 35 milyon aboneye hangi kampanyayı, hangi kanaldan hangi teklif detaylarıyla verilmesi gerektiğini geliştirilen bir kampanya-LM’sine cevaplayabilmek için kampanya-LM’sini de daha küçük LM’lere bölmek gereklidir. Doğru kampanya bulma, doğru kanal bulma, doğru ürün bulma gibi mikro-LM’lere bölerek alt yapı olarak kaynakları etkin ve ölçeklenebilir kullanılması gerekir.
Yıllardır BT sektöründe yazılım geliştirme ve mimari rollerde görev almış profesyoneller olarak bu çözüm yaklaşımı incelendiğinde monolitik uygulamalardan mikro-servis ve data-mesh mimarilere olan evrimin buradaki çözümü ne kadar güzel destekleyeceği görülebilir.
Aslında birbirinden birçok noktada ayrışıyor gibi görünen tipik operasyonel sistem uygulama geliştirme mimarileri ile yapay zeka uygulama geliştirme yaklaşımları bu noktada bir sinerji oluşturabilir.
Ayrışmasının temel sebebinin bir anoloji ile açıklamak gerekirse: klasik kurumsal uygulamalar (CRM, ERP gibi) aslında organlarımıza ve altındaki doku ve hücrelere benzer. Geliştirilen atomik seviyedeki metodları hücreye, metodlardan oluşan nesne yönelimli iş mantıklarını dokuya, iş mantıklarından oluşan uygulamaları organlara benzetebiliriz. Ortak noktaları “belirli görevleri” icra etmeleridir. Kalbin kan pompalaması, midenin yediklerimizi öğütmesi gibi. Kalp bir anda kendi kendine kan pompalamak yerine besin öğütümü yapmaya karar vermez. Kendine has bir bilinci, otonom karar verme yetkinliği yoktur. Fakat üretken zeka ve AGI (genel yapay zeka) ile birlikte gelen teknoloji “niyetinin iyi olmasını beklediğimiz ama %100 emin olamadığımız” tümör hücrelerine benzer. Kendi kendini otonom bir şekilde geliştirebilme yetkinliğini sağladığımız için bizi çok şaşırtan ve yaratıcılığıyla verimliliği çok ciddi boyutlarda artırabilecek boyutlar taşır. O yüzden “beyin” gibi bir organın sürekli bu hücreleri denetleyerek “yanlış yönde ilerlediği” noktalarda bunu kontrol altına alması gerekir. Bu farklılığın “risk” oluşturmaması için iki farklı hücre tipine uygun bir sistem kurmak gereklidir. Tekrar uygulama mimarisine geri döner isek, kontrollü bir şekilde gelişmesine izin vermemiz gereken üretken zeka uygulamalarını verimliliğini ve performansını engellemeden fakat kontrol altına alabileceğimiz mimarilerle kurgulamamız gereklidir.
Doğru mimari çözümümüzü anlatabilmek için öncelikle üretken zeka mantığını, özelleştirilmiş multimodal dil modellerini, mikro-servis ve data-mesh mimarilerinin bu çözümde belirleyici noktalarını açıklamak gereklidir:
Multimodal Dil Modelleri (MLLM):
Çok Modlu Dil Modelleri, metin, görüntü, video, ses, yapısal veri tabanı verisi dahil olmak üzere çeşitli veri kümeleri üzerinde eğitilmiş yapay zeka sistemleridir. Bu farklı modaliteler arasında bilgi anlayabilir ve üretebilirler, böylece insan iletişimini daha yakından yansıtan bir etkileşim düzeyi sağlarlar.
Kurumsal uygulamalarda, MLLM'ler dönüştürücü yetenekler sunabilir:
- Müşteri Etkileşimi: Hem metin hem de görsel içerik içeren sorguları yorumlayarak ve yanıtlayarak müşteri hizmetlerini geliştirmek.
- İçerik Oluşturma: Yazılı ve görsel unsurları birleştiren pazarlama materyallerinin oluşturulmasını otomatikleştirme.
- Eğitim ve Geliştirme: Eğitici metinleri destekleyici görseller ve videolarla birleştiren zengin, etkileşimli eğitim materyalleri sağlama.
Özel Eğitimli, Spesifik Multimodal Dil Modelleri (CMLLM):
Bu modeller, derin öğrenme ve doğal dil işleme teknolojilerini temel alarak, metin, görüntü ve ses dahil olmak üzere çeşitli veri türlerini anlama ve bu türler arasında bağlantılar kurma yeteneğine sahiptirler. Spesifik MLLM'ler, belirli bir alana veya işlevselliğe özel olarak eğitilir; örneğin tıbbi görüntüleme ve raporlama, müşteri hizmetleri diyalogları veya yaratıcı tasarım süreçleri için optimize edilmiş olabilirler.
Genel kullanıma yönelik MLLM'lerin aksine, özel eğitilmiş modeller, eğitim veri setleri, algoritmalar ve hedeflenen çıktılar açısından özelleştirilmiştir. Bu, onların belirli bir sektörün jargonunu, görsel estetiğini veya ses tonunu daha iyi anlamasını ve yorumlamasını sağlar. Örneğin, bir hukuk firması için geliştirilen özel bir MLLM, yasal terimleri ve belgeleri anlama ve oluşturma konusunda standart bir modelden çok daha yetenekli olacaktır.
Bu özelleştirme, modellerin daha yüksek doğrulukta ve bağlam içinde sonuçlar üretmesini sağlar, böylece iş akışlarına doğrudan entegre edilebilirler ve kuruluşların karşılaştığı spesifik zorluklara yönelik çözümler sunarlar. Spesifik MLLM'lerin getirdiği bu derinleştirilmiş anlayış, işletmelerin müşteri etkileşimlerini kişiselleştirmelerine, otomatikleştirilmiş sistemlerin karar verme süreçlerini iyileştirmelerine ve veri analizi sonuçlarını daha kesin hale getirmelerine olanak tanır.
CMLLM’lerin sunduğumuz çözümdeki en önemli özelliği, milyarlarca parametreden oluşan kompleks, monolitik yapıdaki devasa dil modellerinin yerine, mikro-servis’lere yüklenebilecek küçüklükte yetkin, esnek ve yönetilebilir olmasıdır. Çözüm mimarisindeki en kilit yaklaşım noktası devasa dil modellerinin mikro-dil modellerine dönüştürerek atomik seviyede yetkinliklerden oluşan bir CMLLM havuzunu oluşturmaktadır.
Mikro-Servisler’in Rolü
Mikro hizmetler mimarisi, bir uygulamanın, her biri belirli bir iş işlevini yürütmekten sorumlu, gevşek bir şekilde bağlanmış hizmetlerin bir koleksiyonu olarak yapılandırılmasını içerir. Bu tasarım ilkesi doğası gereği modülerdir ve hizmetlerin bağımsız olarak güncellenebildiği, dağıtılabildiği ve ölçeklendirilebildiği çevik bir geliştirme ortamını teşvik eder.
Mikro-servis mimarisi, doğasında bulunan ölçeklenebilirlik ve esneklik nedeniyle MLLM'lerin dağıtımı için idealdir. Her bir mikro servis bağımsız olarak geliştirilebilir, dağıtılabilir ve ölçeklendirilebilir; bu da önemli hesaplama kaynakları gerektiren MLLM'ler için çok önemlidir.
Bu mimari, sürekli entegrasyon ve teslimatı destekleyerek YZ yeteneklerinin hızlı bir şekilde yinelenmesine ve dağıtılmasına olanak tanır. Ayrıca, bir mikro hizmetin arızalanması tüm uygulamayı devre dışı bırakmayacağı için esnekliği de kolaylaştırır.
Data Mesh'in Rolü
Data-mesh, veri mimarisi ve organizasyonel tasarıma yönelik sosyo-teknik bir yaklaşımdır. Veri sahipliğinin ve mimarisinin merkezi olmayan dağıtık yapısını vurgular ve bireysel ekipler bir ürün olarak kendi verilerinin sorumlusu olarak hareket eder. Bu kavram, etki alanı odaklı sahiplik, bir ürün olarak veri, kendi kendine hizmet veren veri altyapısı ve federe bilişimsel yönetişim ilkeleri üzerine kurulmuştur.
Veri Yönetişimi için Data Mesh'in Faydaları
Data-mesh paradigması veri yönetişimine çeşitli faydalar sağlar:
- Özerklik: Ekipler, bir yandan verilerini yönetme ve optimize etme özerkliğine sahip olurken, diğer yandan da bu verilerin keşfedilebilir ve kurumun veri ekosisteminin geri kalanıyla birlikte çalışabilir olmasını sağlar.
- Kalite: Veri ürünleri, verilerin doğruluğu, formatı ve kullanımı konusunda net bir hesap verebilirlikle, tasarım gereği kalite ile oluşturulur.
- Hız: Verileri bir ürün olarak ele alan ekipler, veri iyileştirmelerini hızlı bir şekilde yineleyip sunabilir ve güvenilir verilere daha hızlı erişim sağlayabilir.
- Uyumluluk: Data-mesh, veri ürünleri için sahiplik ve kontrol mekanizmalarını açıkça tanımlayarak yönetişim standartlarına ve yönetmeliklere uyumu kolaylaştırır.
Bir data-mesh, merkezi olmayan veri sahipliği ve yönetimini organize ederek mikro hizmetleri tamamlar. Esasen çeşitli mikro hizmetler arasında bağ dokusu görevi görür ve kurumun veri politikalarına ve standartlarına bağlı kalarak ihtiyaç duydukları verilere erişebilmelerini sağlar.
Mikro-servis mimarisinde, her hizmet kendi verilerini yönetir, ancak Data-mesh, tüm sistem genelinde bu verilere tutarlı, yönetilen erişim sağlayan birlikte çalışabilir bir platform sağlar. Bu, etkili bir şekilde çalışması için çeşitli kaynaklardan gelen farklı veri türlerinin entegrasyonunu gerektiren MLLM'ler için özellikle önemlidir.
Mikro-servisler ve Data-mesh’in birlikte çalışması sayesinde işletmeler, işletmenin değişen ihtiyaçlarına uyum sağlayabilecek sağlam, ölçeklenebilir ve esnek bir yapay zeka altyapısı oluşturabilir.
Özelleştirilmiş Çok Modlu Modellerin (CMLLM) Mikro-Servis ve Data-Mesh mimarisi ile Entegre Edilmesi
Çok modlu dil modellerini bir Data-mesh tarafından desteklenen bir mikro-servisler çerçevesine entegre eden mimari, birkaç temel bileşen içerir:
- Mikro Servisler: 'Metin Analizi', 'Görüntü İşleme' ve 'Veri Alma' gibi bireysel hizmetler belirli MLLM'leri barındırır ve bağımsız olarak çalışır.
- Data Mesh: Hizmetlerin verilere erişmesi ve paylaşması için standartlaştırılmış bir yol sağlayan merkezi olmayan bir veri altyapısı.
- API Ağ Geçidi: Harici talepler için giriş noktası olarak hizmet verir ve bunları uygun mikro-servislere yönlendirir.
- Orkestratör / Birleştirici: Mikro-servisler arasında karmaşık iş akışlarını koordine eder ve çıktılarını birleşik bir yanıtta toplar.
Çok modlu dil modellerinin bir mikro-servis ve Data-mesh mimarisi içinde konuşlandırılmasında, dikkatli bir değerlendirme ve stratejik planlama gerektiren çeşitli zorluklar ortaya çıkmaktadır.
Teknik Zorluklar:
- Entegrasyon Karmaşıklığı: Mikro-servisler ve Data-mesh arasında sorunsuz iletişim sağlamak teknik açıdan zorlu olabilir. Çözümler, sağlam API yönetiminin uygulanmasını ve hizmet düzenleme araçlarının kullanılmasını içerir.
- Veri Tutarlılığı: Dağıtılmış hizmetler ve veri tabanları arasında veri tutarlılığını korumak çok önemlidir. Olay kaynağı ve Komut Sorgusu Sorumluluk Ayrımı (CQRS) gibi teknikler bu sorunu çözmeye yardımcı olabilir.
Ölçeklenebilirlik Zorlukları:
- Dinamik Ölçeklendirme: Mikro-servisler, değişen yüklere yanıt olarak bağımsız bir şekilde ölçeklenebilmelidir. Kubernetes gibi konteyner orkestrasyon platformları hizmet ölçeklendirmesini dinamik olarak yönetebilir.
- Veri Hacmi ve Hızı: Data-mesh yüksek veri hacimlerini ve hızlarını idare etmelidir. Çözümler arasında ölçeklenebilir depolama seçenekleri ve gerçek zamanlı veri işleme çerçeveleri yer alır.
Yönetişim Zorlukları:
- Politika Uygulama: Merkezi olmayan veri alanları arasında tutarlı yönetişim politikaları uygulamak zordur. Data-mesh, her etki alanının bir dizi ortak yönetişim standardına bağlı kaldığı federe yönetişimi mümkün kılarak bu sorunu çözer.
- Güvenlik ve Uyumluluk: Güvenlik stratejileri hem sağlam hem de mikro-servislerin bağımsız yapısına uyum sağlayacak kadar esnek olmalıdır. Güvenli erişim belirteçleri ve otomatik uyumluluk kontrolleri ile API ağ geçitlerinin uygulanması gibi uygulamalar çok önemlidir.
İşletme Zorlukları:
- DevOps ve MLOps Uygulamaları: DevOps ve MLOps uygulamalarının benimsenmesi, dağıtım, ölçeklendirme ve izlemeyi otomatikleştirerek sırasıyla mikro-servislerin ve MLLM'lerin geliştirilmesini ve işletilmesini kolaylaştırabilir.
- Veri Gözlenebilirliği: Data-mesh içinde veri gözlemlenebilirliği araçlarının uygulanması, veri kalitesinin ve anormalliklerin proaktif olarak izlenmesini ve yönetilmesini sağlar.
İşletmeler, bu zorlukları öngörerek ve ele alarak, çok modlu dil modellerinin potansiyelinden tam olarak yararlanan esnek, verimli ve yönetişimle uyumlu yapay zeka sistemleri oluşturabilir.
Yapay Zeka, Mikro-Servis ve Data-Mesh Gelecek Trendleri
Yapay zeka, mikro-servisler ve Data-mesh ortamı sürekli olarak gelişmektedir. İşte gelecekte beklenen bazı trendler:
Yapay Zeka ve Makine Öğrenimindeki Gelişmeler: Hesaplama gücü ve algoritmalar geliştikçe, MLLM'lerin modaliteler arasında gelişmiş anlayış ve üretken yeteneklerle daha da sofistike hale gelmesini bekleyebiliriz.
Mikro-servislerin Genişlemesi: Mikro-servisler muhtemelen daha granüler hale gelecek ve daha fazla verimlilik ve esneklikle çalışabilen daha da özelleşmiş hizmetlere yol açacaktır.
Data-mesh’in İlerlemesi: Data-mesh kavramı olgunlaşacak ve daha fazla kurum bunu veri mimarisi için bir standart olarak benimseyecektir. Bu, otomatik yönetişim ve kalite kontrol araçlarındaki gelişmeleri de içerecektir.
Yapay Zeka ve Operasyonların Yakınsaması: Yapay zekanın AIOps olarak bilinen operasyonel süreçlere entegrasyonu daha yaygın hale gelecek ve gerçek zamanlı veri işleme ve karar vermeye olanak tanıyacaktır.
Uç Yapay Zeka (Edge-AI): IoT ve uç bilişimin büyümesiyle birlikte, yapay zeka işlemenin veri kaynağına yaklaşarak gecikme süresini ve bant genişliği kullanımını azaltması beklenmektedir.
CoPilot & AutoPilot: Üretken zekanın bir sonraki adımlarından birisinin de dil modelleri üzerine inşa edilmiş “yetenekler” olacağı düşünülmektedir. Yetenek, bir ERP sistemine bağlanarak siparişin son durumu öğrenmek, ya da yeni abone olmuş bir müşterinin hat açılma operasyonunu gerçekleştirmek olarak düşünülebilir. Bu yeteneklere sahip üretken zeka uygulamalarının otomatik olarak bazı görevleri yerine getireceği ve RPA / Akıllı Otomasyon teknolojilerinin radikal ölçüde gelişmesi öngörülmektedir.
Genel Yapay Zeka (AGI): AGI'nin amacı, dar alanlarda uzmanlaşmış sistemlerin ötesine geçerek, esnek ve genel amaçlı zeka gösterme yeteneğidir. Basit bir dilde açıklamak gerekirse, her şeyi en iyi bilen süper-yapay zeka formu olarak düşünülebilir. Bu konuda çalışmalar gizli devam etmekte olup, yakın gelecekte gelişmeler olacağı beklenmektedir.