Türkçe ve çok dilli el yazısı ile görselli metinleri yüksek doğrulukla okuyabilen gelişmiş Optik Karakter Tanıma sistemi
DDI Technologies'de AI Intern olarak görev yaptığım süre boyunca geliştirdiğim en kapsamlı proje olan Türkçe OCR Sistemi, Tesseract OCR motoru ve büyük dil modelleri (LLM) teknolojilerini birleştirerek Türkçe karakterlerin doğru tanınmasında yüksek başarı oranı yakalayan gelişmiş bir optik karakter tanıma sistemidir.
Proje, Tesseract'ın güçlü OCR yetenekleri ile LLM tabanlı metin düzeltme ve anlam çıkarma özelliklerini birleştirerek hem el yazısı hem de basılı metinleri yüksek doğrulukla tanıyabilir. Sistem, özellikle Türkçe'deki ç, ğ, ı, ş, ü, ö gibi karakterlerin tanınmasında optimizasyon yapılmıştır.
Benzer teknolojiler kullanılarak geliştirilen diğer projelerim
Computer Vision teknolojileri ile geliştirilen plaka tanıma sistemi
Detayları Gör80 farklı nesneyi tespit edebilen görüntü işleme algoritması
Detayları Gör