
OpenAI’dan CriticGPT: GPT-4’ün Hatalarını GPT-4 Bulacak
OpenAI, GPT-4’e dayalı yeni bir model olan CriticGPT’yi tanıttı. Bu yenilikçi model, insan eğitmenlerin RLHF (Reinforcement Learning from Human Feedback) sürecinde hataları tespit etmelerine yardımcı olmak amacıyla geliştirildi. CriticGPT, ChatGPT’nin yanıtlarını denetleyerek hataları belirlemek ve bu sayede büyük dil modeli (LLM) çıktılarının daha doğru hale gelmesini sağlamak için kullanılacak.
Yerli TEI-TS1400 Motoru Rekor Güce Ulaştı başlıklı yazımız da ilginizi çekebilir.
CriticGPT’nin Amacı ve Kullanımı
CriticGPT, ChatGPT tarafından üretilen programlama kodunu inceleyen insan eğitmenlere destek olmak için tasarlandı. OpenAI, CriticGPT’yi kullanarak kodu gözden geçiren insanların, yardım almayanlara göre %60 oranında daha iyi performans gösterdiklerini belirtiyor. Bu modelin temel amacı, ChatGPT’nin oluşturduğu kodlarda olası hataları tespit etmek ve bu hataları insan eğitmenlere bildirerek daha doğru ve güvenilir çıktılar elde etmektir.
CriticGPT’nin Teknik Özellikleri ve Yetenekleri
CriticGPT, ChatGPT’ye güç veren aynı GPT-4 ailesine dayanıyor. Model, kodu analiz ederken olası hatalara işaret ediyor ve bu sayede insanların fark edemeyebileceği hataların tespit edilmesini kolaylaştırıyor. Araştırmacılar, CriticGPT’yi kasıtlı olarak eklenmiş hatalar içeren kod örneklerinden oluşan bir veri kümesi üzerinde eğitti ve çeşitli kodlama hatalarını tanımayı ve işaretlemeyi öğrettiler.

Yeni Modelin Eleştirileri ve Performansı:
- Kapsamlı Kod İncelemeleri: OpenAI, CriticGPT’nin eleştirilerinin, eğitmenler tarafından doğal hataları içeren vakaların %63’ünde ChatGPT’nin ürettiği eleştirilere tercih edildiğini belirtiyor.
- Force Sampling Beam Search (FSBS) Tekniği: CriticGPT’nin daha ayrıntılı kod incelemeleri yazmasına yardımcı olan bu teknik, modelin kapsamlı incelemeler yapmasını ve gerçek olmayan sorunları daha az sıklıkla uydurmasını sağlıyor.
CriticGPT’nin Kod Dışındaki Yetkinlikleri
OpenAI, CriticGPT’nin yeteneklerinin kodun ötesine geçtiğini de keşfetti. CriticGPT, insanlar tarafından kusursuz olarak değerlendirilen ChatGPT eğitim verilerinin bir alt kümesinde test edildi ve vakaların %24’ünde hatalar buldu. Bu, CriticGPT’nin kod dışı görevlerde de başarılı olabileceğini ve ince hataları yakalama yeteneğini gösteriyor.

CriticGPT’nin Sınırlamaları
CriticGPT, diğer tüm yapay zeka modelleri gibi bazı sınırlamalara sahip:
- Halüsinasyon Görme: Daha dar ve kaliteli bir veri kümesinde eğitilmesine rağmen, CriticGPT halen halüsinasyon görebiliyor ve bu da yanlış etiketlemelere neden olabiliyor.
- Uzun ve Karmaşık Görevlerde Performans: CriticGPT, kısa yanıtlar üzerinde eğitildiği için uzun ve karmaşık görevleri değerlendirmede zorluk yaşayabiliyor.
- Gerçek Dünya Hatalarının Tespiti: CriticGPT, belirli bir yerde tespit edilebilen hataları belirlemede oldukça iyi olsa da, gerçek dünyadaki hatalar bir cevabın birçok bölümünde olabiliyor.
CriticGPT, GPT-4’ün yeteneklerini daha da ileriye taşıyarak hataların tespit edilmesini kolaylaştırıyor ve RLHF sürecinde insan eğitmenlere önemli bir destek sağlıyor. Bu model, özellikle programlama kodlarında olası hataları belirlemek için kritik bir araç olarak öne çıkıyor.
Peki siz bu konu hakkında ne düşünüyorsunuz? Görüşlerinizi aşağıdaki yorumlar kısmından bizlerle paylaşmayı unutmayın!
İyiler Hep Kazanır





