Autor Wątek: .pdf -> plik tekstowy  (Przeczytany 4248 razy)

0 użytkowników i 1 Gość przegląda ten wątek.

Offline Lu Tzy

.pdf -> plik tekstowy
« dnia: Marzec 24, 2008, 11:48:35 am »
Jako informatyczny glupiec zwracam sie z pytaniem do swiatlejszych:
Jak wyekstrahowac z pliku pdf (skany) tekst w postaci strawnej dla np. Worda?
While shepherds watched their flocks by night
    All seated on the ground,
A high-explosive shell came down
    And mutton rained around.

Offline Rhobaak

.pdf -> plik tekstowy
« Odpowiedź #1 dnia: Marzec 24, 2008, 05:28:48 pm »
Skoro to skany, to nie obędzie się bez OCR - narzędzi tego typu jest cała masa (np. firmy ABBYY - FineReader lub dedykowany do tego zadania PDF Transformer).
It is sometimes a mistake to climb; it is always a mistake never even to make the attempt.
If you do not climb, you will not fall. This is true. But is it that bad to fail, that hard to fall?

Offline Lu Tzy

.pdf -> plik tekstowy
« Odpowiedź #2 dnia: Marzec 24, 2008, 06:45:10 pm »
Piekne dzieki.
While shepherds watched their flocks by night
    All seated on the ground,
A high-explosive shell came down
    And mutton rained around.

 

anything