şekil 1.1 girecek
Şekil 1.1. Algoritma geliştirme süreçleri (Sayım 2022). 1.1.1. Yapay Zekânın Tarihi AI çalışmalarının tarihi Cezeri’nin (1136 – 1206) robot çizimlerine kadar uzansa da modern anlamdaki çalışmalar İkinci Dünya Savaşı sonrasında gerçekleşmiştir (Coşkun ve Gülleroğlu 2021). AI ve eleştirel düşüncelerini bilgisayar aracılığıyla simüle etme çalışmaları ilk olarak 1950 yılında Alan Turing tarafından tanımlanmıştır (Holmes ve ark 2004). Turing, Computers and Intelligence (Bilgisayar ve Zeka) adlı kitabında bilgisayarlar ile insan zekasının kıyasını yapmak için “Turing testi” olarak bilinen bir test geliştirmiştir (Greenhill ve Edmunds 2020). Allen Newell ve Herbert Simon 1954 yılında bilgisayarları genel zeka için programlamaya başlayan ilk kişiler olmuşlardır (McCarthy 2007). 1956 yılına gelindiğinde John McCarthy AI terimini “akıllı makineler yapma bilimi ve mühendisliği” olarak tanımlamıştır (Malik ve ark 2019). AI, başlarda “eğer, o zaman kuralları” dizisi olarak bilinirken, ilerleyen yıllarda insan beynine benzer şekilde algoritmaları içerecek gelişmeler göstermiştir (Kutlusoy 2019, Kaul ve ark 2020). 1.1.2. Yapay Zekânın Kullanım Alanları AI, veri madenciliği algoritmalarının bilimsel çalışmalara ve günlük hayata uyarlanması sonucu ortaya çıkmıştır. AI’nın kökeni büyük veriye dayanmaktadır. Son 50 yılda verinin dijital ortamda depolanma düzeyinde inanılmaz artış gerçekleşmiştir. Böylelikle biriken verilerin işlenerek bilgiye dönüştürülme süreci AI’nın önünü açmıştır. AI, veri madenciliğinin bir alt dalıdır. Küçük farklılıklarla birbirlerinden ayrılmasına rağmen günümüzde ML, DL ve AI gibi kavramlar birlikte sıklıkla kullanıldığından iç içe geçmiştir (Altunkaynak 2019). Makine Öğrenmesi Arthur Samuel ML’yi, bilgisayarlara açıkça programlanmadan öğrenme yeteneği kazandıran çalışma alanı olarak tanımlamaktadır. ML, makinelere verileri nasıl daha verimli kullanacaklarını öğretmek için kullanılır. Bazen eldeki verileri yorumlayacak kadar yeterli bilgi mevcut değildir. Bu durumda, ML kullanmak uygun bir seçenek olarak öne çıkmaktadır. (Bkassiny ve ark 2012, Mahesh 2020). ML’nin bazı avantaj ve dezavantajları bulunmaktadır (Hiran ve ark 2021). Avantajları: • Eğilimleri ve örüntüleri kolayca tanımlar. • İnsan müdahalesine gerek yoktur. • Her türlü verinin verimli bir şekilde işlenmesini sağlar. • Sürekli̇ gelişmeye açıktır. Dezavantajları: • Yüksek hata olasılığı. • Veri̇ toplama. • Zaman ve kaynaklar. • Algoritma seçimi. ML, farklı algoritmalar kullanarak problemi çözmeye çalışır. Kullanılan algoritmalar problemin türüne, değişken sayısına ve uygun modele göre değişiklik gösterebilmektedir. ML amaçlarına ve öğretilme şekline göre Denetimli öğrenme, Denetimsiz öğrenme, Yarı-denetimli öğrenme olarak 3 alt kategoriye ayrılmaktadır (Marsland 2011). Denetimli Makine Öğrenmesi Algoritmaları Denetimli ML algoritmalarının regresyon ve sınıflandırma olarak iki türü vardır. Regresyon, eğitim veri kümesinden elde edilen ve algoritmaya verilen en son veri için sürekli değerli sonuçların tahmin edildiği yöntemdir. Bu yöntemde sayısal bir değer tahmin edilmeye çalışılır. Sınıflandırmadaysa amaç bireylerin o sınıflara düşme olasılıklarının tahmin edilmesidir. Örneğin; Şekil 1.2’de kanser hastaları için özet bir veri seti kullanıldığında, kanser olan ve olmayan bireyleri denetimli ML algoritmalarının nasıl ayırdığına dair çalışma prensibi gösterilmektedir (Uddin ve ark 2019).şekil 1.2 girecek
Şekil 1.2. Denetimli ML algoritmalarının kanser hastaları ve sağlıklı bireyleri kategorize etmek için nasıl çalıştığına dair bir örnek. Bir sınıflandırma modeli, eğitim veri setinden bazı geçerli eşleme fonksiyonları çıkarır ve test veri setinde eşleme fonksiyonu yardımıyla sınıf etiketini tahmin eder. Araştırılan özelliğin verilen problem kümesinde bulunan ve doğru bir tahmin modeli oluşturma niteliğine sahip bir parametre olması gerekmektedir (Basak ve Kothari 2004). Sınıflandırma modeli aşağıdaki adımlarla oluşturulabilir (Mandal ve Bhattacharya 2020): 1. Verinin toplanması ve ön işlemlerden geçirilmesi. 2. Sınıflandırıcı modelin belirlenmesi. 3. Çapraz doğrulama kullanarak veri kümesinin bölünmesi ve sınıflandırıcı modelin eğitim verileriyle eğitilmesi. 4. Sınıflandırıcı model ile yeni bir gözlem verisi için etiket tahmini yapılması. 5. Test verisi üzerinde sınıflandırıcı modelin hata oranının değerlendirilmesi. Denetimli ML algoritmalarının iş akış şeması Şekil 1.3’te verilmiştir (Mahesh 2020).şekil 1.3 girecek
Şekil 1.3. Denetimli sınıflandırma modelinin çalışma akış şeması (Mandal ve Bhattacharya 2020). Denetimsiz Makine Öğrenmesi Algoritmaları Denetimsiz öğrenme, herhangi bir dış denetim olmaksızın (denetimli öğrenmede olduğu gibi) verilerin doğal yapısını ortaya çıkarmaya yardımcı olan önemli bir öğrenme algoritmaları sınıfıdır. Tipik bir denetimsiz öğrenme probleminin amacı, öncelikle kümeleme olarak adlandırılan bir grup örnekteki benzerliği keşfetmek, yoğunluk tahmini olarak bilinen veri dağılımını belirlemek veya alt uzay öğrenme kategorisine giren bir boyutsal azaltma yapmaktır (Tyagi ve ark 2022). Denetimsiz öğrenme teknikleri etiketsiz veri kümeleri arasındaki benzerlikleri belirler ve örnek verileri arasındaki benzerliklere göre farklı kümelerde gruplandırır. Denetimli öğrenmenin aksine, denetimsiz öğrenmenin girdileri ve denetleyicileri ile ilişkili bir çıktısı yoktur. Denetimsiz öğrenmede performans, denetimli öğrenmeye kıyasla genellikle öznel ve alana özgüdür. Denetimsiz öğrenme teknikleri genel 2. GEREÇ VE YÖNTEM 2.1. Gereç Bu çalışmada veteriner hekimliği alanında AI ile ilgili güncel literatürü keşfetmek için Clarivate Analytics’in veri tabanı WoS (Philadelphia, PA, United States) kullanılmıştır. WoS ve Elsevier’in Scopus’u en büyük veri tabanlarıdır. Her iki veri tabanı da yayın etiğine uygun çalışmaları kapsamaktadır (Merigó ve Yang 2017). Bu veri tabanlarında veteriner hekimlik alanında AI çalışmaları için yapılan literatür taramasında Scopus ve WoS’ta filtreleme ile sırasıyla 212 ve 467 yayın elde edilmiştir (Şekil 2.1).şekil 2.1 girecek
Şekil 2.1. Bu çalışma için yayın seçim süreci. Şekil 3.7’de AI alanında ülkelere ait işbirliği ağı verilmiştir. Ağdaki düğümlerin büyüklüğü ülkelerin yayın sıklığını göstermektedir. Ağdaki 48 ülke 12 kümeli bir yapı oluşturmaktadır. Aynı kümedeki ülkeler birlikte daha fazla yayın yapma eğilimindedir. Ağ incelendiğinde en fazla işbirliğinin ABD ve Çin’in bulunduğu kümelerde olduğu görülmektedir. Ayrıca bu 2 kümedeki en etkin ülkeler yine ABD ve Çin olduğu tespit edilmiştir. Bağlantı sayısı ve toplam bağlantı gücü dikkate alındığında ABD, Çin, Birleşik Krallık ve Kanada işbirliği ağının etkin ülkeleri olarak karşımıza çıkmaktadır.şekil 3.7 girecek
Şekil 3.7. Ülkeler arası işbirliği haritası. sorumlu yazarların ülkelerine ait işbirliği grafiği verilmiştir. En fazla uluslararası işbirliğine sahip ülke ABD olurken, MCP oranı toplam yayının %37,5’ini oluşturmaktadır. Avustralya ise yayın sayısına göre onuncu sırada yer alırken, MCP oranına göre ilk sırada yer almaktadır.