![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg6fSnPvF2d1iFAE1BeOcZZIRLBFVT-_VVg32k_-xYrDhO32boetgLQJ4jnkJaNgYmnMolFf12OAarQsi72RIgUUcSBorp_Sm2lbxS2u00DVhbnhI6yhPjheyPCKLrPQzVgNBJGpeKvy6C6/s400/ScreenHunter_7.jpg)
Copy&paste дает в ворде файл с белибердой вместо текста:
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhH0CTLCPkAfRuK-yDKmxxkVe2TRqAPf7bIRr_47UqecA104nP1SbEUBlbZDRGJpHKXOodBqhbcxSIQYT6S7rmFdvh0_qPryMat0Qw_ZaZsG2YYbsM8anrE3uzXTOVpTbhKOJk_G2n-PGCD/s400/ScreenHunter_8.jpg)
Дело в шрифтах, судя по всему. В одном:
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi7sYNP5QS0aOccygzspazzZGs2pInXpWsOjtmzTrZCzWeq1qOAvirYhiH1L0DSV-_7oh04AwvcyiK3x6dlYjMNKOt7s1lNMR317eO5OkjY8wtXeiRjKhdmCI5fduhA4f8mIL-rCx7-0TxZ/s400/ScreenHunter_5.jpg)
в другом:
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEinODAQQ9NfIBatooRE6G-NcQh_rHStG3iWYLgziMRIc4eXyShR6DAF5eYZeNGgdPqkwydc9zDMTobhMYmaHsTeg6uESw8B-9ItjksmiTFJu8dPq6Hx9P7j_3Xwiaip_LvOQ3AomCwI8-Z_/s400/ScreenHunter_6.jpg)
Нельзя ли как-нибудь, не прибегая к OCR или файнридеру, а то уж очень муторно?
Заодно, нет ли непыльного способа извлечь текст с гуголь-букса, там где он предлагает только просмотр части текста, без возможности скачивания?
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhG5xh6yUrmuhf20CjYTYISkp-ZEiEcPWz2GmwIy9hnOkp9kj5WR-4sVeiv_LkMCKhBdVu1SaFxo3aV8l7F1lFVS7oEksxmNCZ3JMPlCmWQj8z4n9GKkQgZNLnZjkEd-kOM_L1zK2LO2Bvg/s400/ScrfffeenHunter_4.jpg)
1 комментарий :
в случае «хитрых» пдфов я бы плюнул и распознал файнридером.
а для гуглобуксов есть отличный даунлоадер: http://www.addictivetips.com/windows-tips/a-complete-guide-how-to-download-books-from-google-in-pdf-format/
Отправить комментарий