PDF'i XML'e Dönüştür
PDF dosyalarından yapılandırılmış metni ve meta verileri XML formatında ayıklayın.
PDF XML'e Nasıl Dönüştürülür?
1.
PDF Yükleyin – Ayıklamak istediğiniz metni ve yapıyı içeren PDF belgesini seçin.
2.
XML'e Ayıklayın – Belge yapısını XML düğümlerine (nodes) ayıştırmak için dönüştüre tıklayın.
3.
XML İndirin – Ayıklanan XML dosyasını cihazınıza kaydedin.
Düğümleri ve Meta Verileri Ayıklayın
Bir PDF belgesi yükleyin. Araç, metin dizelerini ve düzen işaretlerini yapılandırılmış XML düğümlerine ayıklar.
Taranmış PDF'ler Hakkında
Standart XML ayıklama, taranmış dosyalardan yalnızca görüntü kapsayıcılarını yakalar. Metin öğelerinin tanınmasını sağlamak için önce belgeyi OCR PDF ile işlemeniz gerekir.
Parola Korumalı PDF'ler
Şifreleme, yapısal ayrıştırmayı engeller. XML dönüştürme için dosyayı yüklemeden önce parolayı kaldırmak için PDF kilidini aç özelliğini kullanın.
Sıkça Sorulan Sorular
PDF'den XML'e dönüştürme ne işe yarar?
PDF'nin dahili yapısını ayrıştırır ve metni, yazı tiplerini ve düzen öğelerini XML düğümleriyle eşleştirir.
Bu araç tablo hücrelerini tanır mı?
Evet, temel tablo yapıları XML'e eşlenir. Ancak doğrudan hesap tablosu içe aktarımları için CSV'ye dönüştürmek genellikle daha verimlidir.
XML dosyamda neden metin eksik?
Kaynak PDF taranmış bir belgeyse veya düz görüntülerden oluşuyorsa, ayrıştırılabilir metin oluşturmak için önce dosyayı OCR'dan geçirmeniz gerekir.
XML görüntüleri içeriyor mu?
Hayır. XML çıktısı kesinlikle belgedeki yapısal metni ve meta verileri ortaya çıkarmaya odaklanır.
Aynı anda birden fazla PDF işleyebilir miyim?
Evet, toplu yükleme yapabilirsiniz. Araç bunları tek tek ayrıştıracak ve ayrı XML dosyaları oluşturacaktır.
XML okumak için özel bir yazılıma ihtiyacım var mı?
XML düz metin işaretleme dilidir. Herhangi bir kod düzenleyici, metin düzenleyici ile açılabilir veya komut dosyalarıyla programatik olarak ayrıştırılabilir.
XML çıktısı biçimlendirilmiş mi?
Evet, ayıklanan kod standart girintilerle biçimlendirilmiştir, bu da onu insanlar için okunabilir hale getirir.
Verilerim güvende mi?
Evet. Ayrıştırma HTTPS üzerinden gerçekleşir ve yüklediğiniz PDF belgeleri ile sonuç XML dosyaları işlendikten kısa bir süre sonra sunucularımızdan silinir.