А как насчёт поставить CuneiForm и распознать текст самому? - Обсуждение - Работа «Плантариума» - Форум

Просмотры: 7509
Обсуждение

Дмитрий Орешкин	\| изменено изменил(а): Дмитрий Орешкин, 1 Павел Евсеенков пишет: Может когда-нибудь, долгими зимними, кто-то оформит. http://www.plantarium.ru/page/view/item/47710.html Павел, а как насчёт поставить CuneiForm и распознать самому? Делов-то на 5 минут.
Павел Евсеенков	2 Никогда этим не занимался, надо учиться с нуля. Если 5 минут, то может быстрее вы сделаете ?
Дмитрий Орешкин	3 Потратьте 10 минут на обучение, потом будет проще. А я что-нибудь другое распознаю.
Павел Евсеенков	4 Дмитрий Орешкин пишет: Потратьте 10 минут на обучение,.. Я правда кажусь таким умным ? Это надо исправлять Кому 10 минут, а кому с 17-го года надо начинать учить.
Дмитрий Орешкин	5 Не надо до 17-го года откладывать Чтобы распознать текст, особого ума не нужно - нужны навык и внимательность. И вообще, не боги горшки обжигают!
Павел Евсеенков	6 Ну скачал я эту прогу, но пока как баран на новые ворота. Чувствую, потратить придётся пол дня минимум что бы понять принцип работы. И этим я займусь видимо не скоро. Кстати, будет не плохо если кто-нибудь напишет пошаговую инструкцию,- может пригодится не только мне.
Дмитрий Орешкин	7 Принцип работы прост - CuneiForm загружает изображения из файла или со сканера, распознаёт там буквы и представляет их как печатный текст. Этот текст можно скопировать в буфер обмена и куда-нибудь вставить (например, в форму на странице "Ботаническое описание") или сохранить как файл. Кстати, тексты для распознавания можно легко получить из DjVu файлов, знакомых всем, кто пользуется библиотекой Шипунова - выделяешь нужный кусок и экспортируешь в PNG-файл.
Дмитрий Орешкин	8 1. Открываем файл (жмём кнопку с треугольничком). В иконка на кнопке изменится и по умолчанию загрузка будет из файла - сразу можно жать на кнопку, а не на треугольник справа. 2. После выбора файла и его загрузки видим картинку: 3. Жмём кнопку "Распознавание", и программа в меру своих способностей превращает картинку в буквы, попутно выделяя незнакомые или сомнительные слова: 4. Внимательно читаем текст и исправляем ошибки (русские буквы зачастую заменяются английскими, вместо знаков пунктуации прога вставляет буквы и т.п.). После этого выделяем исправленный текст, копируем его в буфер обмена и вставляем в форму. png CuneiForm-1.png png CuneiForm-2.png png CuneiForm-3.png
Павел Евсеенков	9 Спасибо, вроде получается !
Дмитрий Орешкин	10 Павел, и Вам огромное спасибо! С почином!!!
Дмитрий Орешкин	11 При проверке текстов нужно обращать внимание, что при указании диапазонов значений тире пробелами окружать не нужно: 2—4 см в диаметре
Дмитрий Орешкин	12 И чтобы текст красиво разбивался на абзацы, между ними нужно вставлять пустую строчку. Впрочем, это уже из оперы о форматировании текстов.
Павел Евсеенков	\| изменено изменил(а): Павел Евсеенков, 13 Хотя бывает и так jpg 2014-08-17_113113.jpg
Дмитрий Орешкин	14 Да, если картинка - JPEG или просто плохого качества. Тексты лучше сохранять в PNG - он аккуратнее обращается с границами изображений, и распознаётся такой текст лучше.
Павел Евсеенков	15 Да, там изначально качество плохое.
Татьяна Винокурова	16 Павел, а как догадаться про слова, которые распознаются неверно? Вот ещё "корневище" куда ни шло, а уже "симподиально" и пр. - только знаток такую анаграмму расшифрует Да и другие слова не легче... Но мне понравился процесс
Павел Евсеенков	17 Такие страшные слова программа сразу помечает как сомнительные, и тогда сверить с оригиналом уже не сложно.
Павел Евсеенков	18 Татьяна, я тоже не знаю про что, но это просто песня "Корневище удлиненное, симподильно ветвящееся, гипогеогенное, с многочисленными кладогенными корнями. Монокарпические побеги дициклические"
Эльвир Измайлов	19 Для меня звучит также как стих "Бармаглот" Варкалось. Хливкие шорьки Пырялись по наве, И хрюкотали зелюки, Как мюмзики в мове.
Павел Евсеенков	20 Думаю, всё не так сложно, и с помощью жестов и матов это тоже можно объяснить
Татьяна Винокурова	21 Даже в таком серьёзном деле найдётся над чем пошутить и посмеяться Два лайка от меня
Павел Евсеенков	22 Мне посоветовали попробовать ABBYY FineReader. Попробовал. Действительно, плохое качество он "видит"лучше чем CuneiForm.
Дмитрий Орешкин	23 Распознавание текстов в Ubuntu

А как насчёт поставить CuneiForm и распознать текст самому?Обсуждение / Работа «Плантариума» / Форум

Просмотры: 7509Обсуждение

А как насчёт поставить CuneiForm и распознать текст самому?
Обсуждение / Работа «Плантариума» / Форум

Просмотры: 7509
Обсуждение