DDI Technologies

Türkçe OCR Sistemi

Türkçe ve çok dilli el yazısı ile görselli metinleri yüksek doğrulukla okuyabilen gelişmiş Optik Karakter Tanıma sistemi

95%
Doğruluk Oranı
3
Ay Geliştirme

Proje Hakkında

DDI Technologies'de AI Intern olarak görev yaptığım süre boyunca geliştirdiğim en kapsamlı proje olan Türkçe OCR Sistemi, Tesseract OCR motoru ve büyük dil modelleri (LLM) teknolojilerini birleştirerek Türkçe karakterlerin doğru tanınmasında yüksek başarı oranı yakalayan gelişmiş bir optik karakter tanıma sistemidir.

Proje, Tesseract'ın güçlü OCR yetenekleri ile LLM tabanlı metin düzeltme ve anlam çıkarma özelliklerini birleştirerek hem el yazısı hem de basılı metinleri yüksek doğrulukla tanıyabilir. Sistem, özellikle Türkçe'deki ç, ğ, ı, ş, ü, ö gibi karakterlerin tanınmasında optimizasyon yapılmıştır.

Projede Rolüm

Veri setinin hazırlanması ve iyileştirilmesi

  • Tesseract OCR Model Geliştirme ve Büyük Dil Modeli İle Entegrasyonu
  • Tesseract ve Gemini AI kullanarak derin öğrenme modellerinin tasarlanması
  • Uygulama mimarisinin optimize edilmesi

Veri İşleme ve Hazırlama

  • Türkçe el yazısı örneklerinden oluşan geniş veri setinin toplanması
  • Görüntü ön işleme ve veri artırma tekniklerinin uygulanması
  • Farklı yazı tiplerinde test verilerinin hazırlanması

Kullanıcı Arayüzü Geliştirme

  • Python Flask framework ile web tabanlı arayüz geliştirme
  • Drag & drop dosya yükleme özelliğinin implementasyonu
  • Gerçek zamanlı OCR sonuçlarının görüntülenmesi

Sonuçlar ve Başarılar

Performans Metrikleri

  • Türkçe El Yazısı Doğruluğu: 95.2%
  • Basılı Metin Doğruluğu: 98.7%

Özel Başarılar

  • Türkçe karakterlerin %98 doğrulukla tanınması
  • Karışık el yazılarında bile yüksek performans
  • Gerçek zamanlı işleme kapasitesi
  • Şirket içi kullanıma hazır prototip

Proje Bilgileri

Şirket
DDI Technologies
Süre
Haziran - Ağustos 2024
Takım Büyüklüğü
1 kişi (Solo Proje)
Rolüm
AI Intern - Full Development

Kullanılan Teknolojiler

Python Tesseract LLM OpenCV Flask NumPy PIL HTML/CSS

İlgili Projeler

Benzer teknolojiler kullanılarak geliştirilen diğer projelerim

Plaka Tanıma Sistemi

Computer Vision teknolojileri ile geliştirilen plaka tanıma sistemi

Detayları Gör

EasyBin - Akıllı Geri Dönüşüm

Geri dönüştürülebilir malzemeleri tanımlayan AI sistemi

Detayları Gör

Drone Nesne Tespit Sistemi

80 farklı nesneyi tespit edebilen görüntü işleme algoritması

Detayları Gör