А как насчёт поставить CuneiForm и распознать текст самому?
Обсуждение / Работа «Плантариума» / Форум

Плантариум
определитель растений онлайн

Обсуждение

Павел Евсеенков пишет:
Может когда-нибудь, долгими зимними, кто-то оформит.
http://www.plantarium.ru/page/view/item/47710.html Павел, а как насчёт поставить CuneiForm и распознать самому? Делов-то на 5 минут.
Никогда этим не занимался, надо учиться с нуля. Если 5 минут, то может быстрее вы сделаете ?
Потратьте 10 минут на обучение, потом будет проще. А я что-нибудь другое распознаю.
Дмитрий Орешкин пишет:
Потратьте 10 минут на обучение,..
Я правда кажусь таким умным ? Это надо исправлять :) Кому 10 минут, а кому с 17-го года надо начинать учить.
Не надо до 17-го года откладывать ;) Чтобы распознать текст, особого ума не нужно - нужны навык и внимательность. И вообще, не боги горшки обжигают!
Ну скачал я эту прогу, но пока как баран на новые ворота. Чувствую, потратить придётся пол дня минимум что бы понять принцип работы. И этим я займусь видимо не скоро. Кстати, будет не плохо если кто-нибудь напишет пошаговую инструкцию,- может пригодится не только мне.
Принцип работы прост - CuneiForm загружает изображения из файла или со сканера, распознаёт там буквы и представляет их как печатный текст. Этот текст можно скопировать в буфер обмена и куда-нибудь вставить (например, в форму на странице "Ботаническое описание") или сохранить как файл. Кстати, тексты для распознавания можно легко получить из DjVu файлов, знакомых всем, кто пользуется библиотекой Шипунова - выделяешь нужный кусок и экспортируешь в PNG-файл.
1. Открываем файл (жмём кнопку с треугольничком). В иконка на кнопке изменится и по умолчанию загрузка будет из файла - сразу можно жать на кнопку, а не на треугольник справа. 2. После выбора файла и его загрузки видим картинку: 3. Жмём кнопку "Распознавание", и программа в меру своих способностей превращает картинку в буквы, попутно выделяя незнакомые или сомнительные слова: 4. Внимательно читаем текст и исправляем ошибки (русские буквы зачастую заменяются английскими, вместо знаков пунктуации прога вставляет буквы и т.п.). После этого выделяем исправленный текст, копируем его в буфер обмена и вставляем в форму.
Спасибо, вроде получается !
Павел, и Вам огромное спасибо! С почином!!!
При проверке текстов нужно обращать внимание, что при указании диапазонов значений тире пробелами окружать не нужно:
2—4 см в диаметре
И чтобы текст красиво разбивался на абзацы, между ними нужно вставлять пустую строчку. Впрочем, это уже из оперы о форматировании текстов.
Хотя бывает и так :)
Да, если картинка - JPEG или просто плохого качества. Тексты лучше сохранять в PNG - он аккуратнее обращается с границами изображений, и распознаётся такой текст лучше.
Да, там изначально качество плохое.
Павел, а как догадаться про слова, которые распознаются неверно? Вот ещё "корневище" куда ни шло, а уже "симподиально" и пр. - только знаток такую анаграмму расшифрует :rolleyes: Да и другие слова не легче... Но мне понравился процесс :)
Такие страшные слова программа сразу помечает как сомнительные, и тогда сверить с оригиналом уже не сложно.
Татьяна, я тоже не знаю про что, но это просто песня :D "Корневище удлиненное, симподильно ветвящееся, гипогеогенное, с многочисленными кладогенными корнями. Монокарпические побеги дициклические"
Для меня звучит также как стих "Бармаглот" Варкалось. Хливкие шорьки Пырялись по наве, И хрюкотали зелюки, Как мюмзики в мове.
Думаю, всё не так сложно, и с помощью жестов и матов это тоже можно объяснить :D
Даже в таком серьёзном деле найдётся над чем пошутить и посмеяться :D Два лайка от меня :) :)
Мне посоветовали попробовать ABBYY FineReader. Попробовал. Действительно, плохое качество он "видит"лучше чем CuneiForm.
Распознавание текстов в Ubuntu
Поиск
Top.Mail.Ru Обратная связь Наверх
www.plantarium.ru