Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.







 Palacz
 Palacz
	








Muszę zeskanować pewną unikalną książkę.
Teraz pytanie.
Jak widzę xsane oferuje skanowanie do PDFa i nawet działa.
Problem w tym ze tekst jest w poprzek (tak muszę położyć książkę na scannerze.)
Da sie to w jakimś sofcie obrócić o 90 stopni ?
Ewentualnie do jakiego formatu scanować aby najmniej było roboty przy składaniu wszystkiego w jakiś jeden sensowny dokument. PDF czy DOC czy ODT nawet txt.
Chodzi o to aby cała księzka byl w jednym dokumencie elektronicznym.
Offline



 Też człowiek :-)
 Też człowiek :-)
	




Zobacz pakiet imagemagick i polecenie convert.
Offline






 Admin łajza
 Admin łajza
	







Zeskanuj do obrazów, ustaw jak chcesz (np. ww. convertem, gimpem) i połącz... convertem:
convert plik1.jpg plik2.jpg plik3.jpg plik.pdf
Offline







 Palacz
 Palacz
	








azhag napisał(-a):
Zeskanuj do obrazów, ustaw jak chcesz (np. ww. convertem, gimpem) i połącz... convertem:
Tak to będzie dobre wyjście.
Dzięki.
Offline



 Redaktor
 Redaktor
	



ilin, skanuj do formatu png. Następnie tak jak napisali wcześniej popraw w gimpie. Minimalna rozdzielczość to 300dpi. Użyj najlepiej 450dpi.. Jeżeli będziesz ją rozpoznawał to strony posiadające obrazki skanuj dzieląc na tekst i grafikę.
Dodano:
Format png jest lepiej przenośny do programów rozpoznawania tekstu pod Windows. Nie opłaca się skanować do formatu tif. Format tif tworzony pod Linuksem często jest źle interpretowany w Windows np. przez program ocr recognita.
Mając pliki png możesz jej wstawić do np. Openoffice i następnie pdf.
Ostatnio edytowany przez fnmirk (2009-09-24 15:53:09)
Offline







 Palacz
 Palacz
	








Skanuję w maksymalnej jakosci to chyba 600dpi
W PNG to strasznie duże pliki wychodzą jeden scan jakieś 84Mb.
Zacząłem robić do jpeg.
Jakość niezgorsza.
Jeszcze przetestuję zmniejszyć rozdzielczość jak pogorszy się jakość względem wagi dokumentu.
Obrazków tam nie ma bo to książka historyczna można powiedzieć.
Offline






 Admin łajza
 Admin łajza
	







fnmirk napisał(-a):
Mając pliki png możesz jej wstawić do np. Openoffice i następnie pdf.
Convert obsługuje PNG, tak samo jak JPG, GIF i inne popularne formaty.
Offline



 Redaktor
 Redaktor
	



Wystarczy 300-450.dpi. Książka nie była drukowa z większą rozdzielczością niż 200-300dpi. Nie ma sensu skanować z większą rozdzielczością.
Nie wszystkie strony musisz skanować w kolorze. Maksymalna wielkość pliku skanowanej strony u mnie, w kolorze i w formacie A4 nie przekracza nigdy 40-50MB.
Jeżeli skanujesz po dwie strony w jednym przebiegu to później je podzielisz i będzie mniej.
Png jest formatem bezstratnym i lepszym do przechowywania obrazków niż jpg.
ilin napisał(-a):
Skanuję w maksymalnej jakosci to chyba 600dpi
Nie skanujesz w takiej. Skaner to przetwarza i niepotrzebnie marnujesz miejsce na dysku. Lepiej jest wykonać skan obrazka w mniejszej o połowę rozdzielczości, uzyskując mniejszy plik wynikowy. Przeciętnie jest to 300-450dpi i następnie w razie potrzeby wykonać interpolację w programie graficznym. Wyjdzie na to samo i uzyskamy; lepszą jakość. Większość skanerów przy wyższych rozdzielczościach wspomagają się interpolacją i robią to gorzej niż programy graficzne.
Ostatnio edytowany przez fnmirk (2009-09-24 16:36:07)
Offline



 Nadworny matematyk
 Nadworny matematyk
	




Pozwólcie, że się podepnę... 
Musze zeskanować książkę do pdf. Problem jest taki, że chciałbym mieć możliwość przeszukiwania w niej, jak to w pdf'ach bywa. Ona sama jest jednym wielkim czarno-białym kserem książki (uważam, że dobrym). Są tam kody (oczywiście w ang), ale głownie polski tekst. 
Jak to zrobić dobrze, żeby się nie narobić za wiele (nie chce robić tego kilka razy ;p) i jakim programem. Wiem, że pod Linux'a nie ma takiej możliwość więc może ktoś coś zna pod $hit'a? Rozumiem, że będę musiał to zeskanować jakimś programem do OCR do jakiegoś formatu (nie wiem jakiego) a potem z tego zrobić pdf? Może da się zrobić to bezpośrednio? Nie wiem też ile dpi i w ogóle... 
Robił ktoś kiedyś takie cuś? Z jakim wynikiem?
Pozdrawiam
Offline







 Palacz
 Palacz
	








Pod windowsa jest bardzo dobry ale komercyjny
finereader
Pod lina tez już się poprawia.
tesseract-ocr plus tesseract-ocr-pol
Nakładka na to 
yagf
Potestuj na 1-2 stronach i wybierz optymalne parametry.
Offline



 Nadworny matematyk
 Nadworny matematyk
	




Będę patrzeć. Dzięki bardzo.
Offline


 Gambini
 Gambini
	



Przepraszam za offtop, ale nie mogłem się powstrzymać. Czytając temat "Skanowanie książki", od razu skojarzyło mi się pytanie: "czy mogę?", "czy jest to legalne"?, a nie jak to zrobić:)
Offline




 Użyszkodnik
 Użyszkodnik
	Oczywiście, że jest legalne. Jeżeli masz prywatny egzemplarz drukowanej książki, to nikt nie powinien się wtrącać, co z nim robisz.
Samo zdigitalizowanie książki nie jest przestępstwem i jest jak najbardziej dopuszczalne moralnie. Wątpliwości można mieć co najwyżej odnośnie do rozpowszechniania książki w takim formacie.
Offline



 Smoleńsk BULWA!
 Smoleńsk BULWA!
	




@P@blo:
Tylko radze na cuda nie liczyć, niestety nawet komercyjne programy często potrafią mieć problemy z OCR, do tego dochodzi konieczność ręcznego przeglądania każdej zeskanowanej strony i szukania błędów - tak więc nie jest to szybki proces. No chyba że coś się zmieniło w przeciągu ostatnich 3 lat, ale wątpię.
Pozdro.
Offline






 Ojciec Założyciel
 Ojciec Założyciel
	FineReader się uczy.Po kilku zeskanowanych stronach będzie błędy wyłapywał w mig.
Offline



 Nadworny matematyk
 Nadworny matematyk
	




No po pierwszych próbach mogę powiedzieć, że tesseract w ogóle nie potrafi sobie poradzić. Właściwie to nic nie przeczytał... Tak więc szczerze odradzam... No a mam trial FinReader'a i tu jest inna bajka. Rzeczywiście czasami nie wyłapie wszystkiego ale powiedzmy 95% zrobi dobrze. No niestety, jest komercyjny :/
Pozdrawiam
Offline


 Gambini
 Gambini
	



Zawsze można zeskanować do pdf lub png i użyć OCR'a online, których jest cała masa. Bezpłatnych oczywiście.
Osobiście polecam: http://www.newocr.com/. Używam od dość dawna.
Offline

 Użytkownik
 Użytkownik
	


Najlepszym formatem dla skanowanych książek jest DjVu. W Polsce mało znany i stosowany a szkoda, bo pozwala na zachowanie oryginalnego wyglądu stron przy zdumiewająco małym rozmiarze pliku. Podobnie jak w PDFie jest możliwość nałożenia niewidocznego zOCRowanego tekstu na obrazkowe strony, co umożliwia łatwe wyszukiwanie. Wiem, że są pod Debianem narzędzia do tworzenia plików DjVu ale nie miałem okazji ich wypróbować, bo nie mam skanera. Jeżeli ktoś z Was używał, to ciekaw jestem wrażeń.
Offline







 Palacz
 Palacz
	








tesseract się gubi przy skanowaniu w niskiej rozdzielczości.
Offline



 Nadworny matematyk
 Nadworny matematyk
	




No to jak wielka ma być ta rozdzielczość? Robiłem na 300dpi bo 600 się nie dało (nie wiem czemu)...
@radziojedi: Sugerujesz, że mam zrobić pdf (z jpeg'ów - tak mi się wydaje) powiedzmy czymś takim jak simple-scan (bo tego używam na co dzień do skanowania, a potem tym konwerterem?
EDIT: O JEJ! To co mi podałeś (online) to po jednej stronie robi? To stanowczo za dużo na klikanie... Książka ma bardzo dużo stron... Mogę zeskanować, ale potem, żeby to wszystko się samo zrobiło... No i żeby obrazki też kopiował... Bo podany tego nie robi...
Ostatnio edytowany przez P@blo (2012-03-25 12:52:28)
Offline