ESC
Sonuç bulunamadı
Ana Sayfa
EN

İndeksleme Sistemi

Hash tabanlı indeksleme ile 100.000+ dosyada anlık arama.

İndeksleme Nedir?

İndeksleme, UDF dosyalarının içeriğini önceden işleyerek aramayı hızlandıran bir ön hazırlıktır.

Durum10.000 Dosya Arama Süresi
İndekssiz5-10 dakika
İndeksli1 saniyenin altında

Hash Tabanlı İndeksleme

Çolpan, SHA-256 hash tabanlı akıllı indeksleme kullanır.

Çalışma Mantığı:

  1. UDF dosyası açılır (ZIP formatı)
  2. content.xml içeriği okunur
  3. İçerik normalize edilir (küçük harf, Türkçe)
  4. SHA-256 hash hesaplanır (16 karakter)
  5. Hash + içerik veritabanına kaydedilir

Avantajlar:

  • Aynı içerikli dosyalar tek hash ile saklanır
  • Değişmemiş dosyalar tekrar indekslenmez
  • 1000x’e kadar hızlanma

İndeks Dosya Yapısı

Her dizin için üç dosya oluşturulur:

index_C_Users_Documents\
├── header.txt      (Dosya listesi ve hash mapping)
├── content.bin     (Normalize edilmiş içerikler)
└── content.idx     (Hash → konum haritası)

header.txt Formatı:

hash|dosya_yolu|boyut|tarih|offset|uzunluk
a1b2c3d4e5f6g7h8|C:\doc\file.udf|1024000|2024-12-22|0|32768

İndeksleme İşlemleri

İlk İndeksleme

  1. Dizin tablosunda istediğiniz satıra sağ tıklayın
  2. İndeksle (Hash-Based) seçeneğini tıklayın
  3. Progress dialog açılır
  4. Tamamlandığında indeks kullanıma hazırdır

İndeksleme Süresi (Tahmini):

Dosya SayısıSSDHDD
1.00010-30 sn1-3 dk
10.0002-5 dk10-30 dk
100.00020-60 dk2-5 saat

İndeks Güncelleme

Mevcut indeksi, yeni/değişen dosyalarla günceller.

  1. Dizine sağ tıklayın
  2. İndeksi Güncelle seçin
  3. Sadece değişen dosyalar işlenir (hızlı)

Ne Zaman Güncellemeli:

  • Dizine yeni dosya eklendiyse
  • Mevcut dosyalar değiştiyse
  • “İndeks eski” uyarısı görüyorsanız

İndeks Optimizasyonu

Kullanılmayan hash kayıtlarını temizler, indeks boyutunu küçültür.

  1. Dizine sağ tıklayın
  2. İndeksi Optimize Et seçin
  3. Gereksiz veriler temizlenir

Ne Zaman Optimize Etmeli:

  • Çok fazla dosya silindikten sonra
  • İndeks boyutu beklenenden büyükse
  • Ayda bir düzenli bakım olarak

İndeks İstatistikleri

Dizinin indeks durumu hakkında bilgi verir:

📂 Dizin: C:\Dosyalar
📄 Dosya sayısı: 15.432
📦 İndeks boyutu: 245 MB
📝 Header boyutu: 12 MB
💾 Toplam: 257 MB
⏰ Son güncelleme: 2024-12-22 10:30

İndeks Boyutları

Dosya Sayısıİndeks Boyutu
1.00010-30 MB
10.000100-300 MB
100.0001-3 GB

Yönetim İpuçları

  1. Büyük dizinleri bölün: 100.000+ dosya yerine alt klasörler oluşturun
  2. SSD kullanın: İndeksleme 3-5x daha hızlı olur
  3. Düzenli güncelleyin: Haftada bir güncelleme önerilir
  4. Eski arşivleri ayırın: Nadiren değişen arşivler ayrı profilde tutun
  5. Temp klasörünü temizlemeyin: %TEMP%\Colpan\ indeksleri içerir

Manticore Search İndeksleme

Hash-tabanlı indekse ek olarak Manticore Search kullanabilirsiniz.

Manticore Avantajları

ÖzellikHash IndexManticore
RankingAlfabetikBM25 (alakalılık)
Karmaşık sorgularOrtaHızlı
Bellek kullanımıDüşükOrta-Yüksek

Manticore İndeksleme

  1. Dizine sağ tıklayın
  2. “Manticore’a İndeksle” seçin
  3. Hash index ile paralel çalışır
  4. BM25 skorlu arama aktif olur

İki Sistem Birlikte

Colpan her iki sistemi de kullanabilir:

  • Hash: Hızlı filtreleme
  • Manticore: Alakalılık sıralaması

İndeks Konumları:

%TEMP%\Colpan\
├── Profil_N\           (Hash indeksleri)
│   └── index_xxx\
└── manticore_data_N\   (Manticore DB)

Sorun Giderme

SorunBelirtiÇözüm
Bozuk indeksArama sonuç vermiyorDizini sil, tekrar indeksle
Eski indeks”24+ saat” uyarısıİndeksi güncelle
Eksik dosyalarBazı dosyalar çıkmıyorTümünü yenile
Büyük indeksDisk doluyorOptimize et
Manticore syncSonuçlar farklıHer iki sistemi yeniden indeksle