«Локализатор исходного кода» предназначен для локализации программных продуктов путем изменения их исходных кодов без предварительной подготовки.
Программа может быть использована при разработке программного обеспечения на серверах сборки, для автоматической локализации исходного кода, но она может также применяться и на рабочих компьютерах пользователей для проверки орфографии в исходных кодах, текстовых файлах, буфере обмена и словарях переводов.
Специальная версия программы позволяет проводить обфускацию исходного кода.


 

четверг, 21 ноября 2013 г.

Проверка орфографии на сайтах основанных на mediawiki

Mediawiki популярная CMS для разработки сайтов в стиле wikipedia, позволяющая
организовать отлично структурированный справочный(обычно) сайт, которая не только позволяет легко получить необходимую информацию с помощью простой навигации, но и дает возможность пользователям сайта вносить правки в статьи.

Множество проектов использует эту CMS или схожую с ней.

Такими проектами являются: 

  • Справочный сайт ОС OpenSuse - http://ru.opensuse.org/ (MediaWiki 1.19.3)
  • Популярный сайт игровой тематики sc2tv - http://sc2tv.ru/wiki (MediaWiki 1.19.2)
  • Публичная неофициальная документация хостинга 1gb.ru - http://1gb.ru/wiki (MediaWiki)
  • Школьная база знаний - http://wiki.nntc.nnov.ru (MediaWiki 1.19.2)

Ряд проектов используют схожие CMS, например Справочный сайт ОС Ubuntu - http://help.ubuntu.ru/wiki/ (DokuWiki)


Приведенный далее пример проверки орфографии рассчитан на MediaWiki, но возможно подойдет и для DocuWiki (Ubuntu).

Как видно из приведенного перечня сайтов, данная CMS успешно применяется для различных сфер деятельности.

В тоже время на ряде сайтов присутствуют ошибки:
  • ru.opensuse.org/openSUSE:Общение - см. "новичек"
  • help.ubuntu.ru/wiki/virtualbox - см. "диаллог". Слово "cистемы" начинается с латинской буквы, в "сd-rom" - русская "с", что делает невозможным нахождение таких слов поиском, что может быть серьезной проблемой поиска термина в wiki, если в нем будет такая опечатка.
  • sc2tv.ru/wiki/index.php?title=Заглавная_страница - см. "комаду", "едиственным".

Перечисленные ошибки обнаружены 21-11-2013 и, соответственно, их можно найти в истории, если они будут исправлены. Я на это рассчитываю, так как обращусь к данным порталам с предложением проверки их wiki-проектов, что позволит улучшить ситуацию с орфографией на порталах и заодно проверить возможности моей программы. При разрешении публикации таких отчетов по wiki - выложу их в обновлениях к данному посту.

вторник, 12 ноября 2013 г.

Граф орфографических ошибок

Программа локализации успешно строит различные отчеты по орфографическим ошибкам в исходных кодах проектов, например, для Ubuntu, см. "Результаты проверки орфографии исходного кода Ubuntu 13.04"

Отчеты представлены в виде xml в формате junit, а также в виде html-документов с применением гиперссылок для связывания отчетов и подотчетов, а также css-оформлением для большей наглядности и удобства использования.

Но в больших проектах со значительным количеством ошибок текстовые отчеты не дают возможности увидеть общую картину ошибок и отслеживать процесс исправления, как позволяют простые картинки инфографики, на которых отражена ключевая информация.

В качестве одной картинки, по которой можно оценить объем исправлений и проверить текущее состояние проекта с точки зрения орфографии, я решил реализовать в программе создание графов со специальным оформлением.

Пример графа для каталога примеров программы локализации:
 
PDF-версия графа.

Описание графа:

  • желтым очень крупно - каталоги;
  • серым - файлы, в которых нет слов для проверки;
  • зеленым - файлы, в которых есть слова, но нет ошибок;
  • красным крупно - файлы со словами, в которых есть орфографические ошибки.

Единым корнем графа является "каталог" "ROOT". Файлы не относящиеся к локализации (временные, картинки, пр.) в графе игнорируются.

Построил общий граф без учета орфографии по всем файлам DoubleCommander для примера проекта со сложной структурой (скачать http://sourceforge.net/projects/doublecmd/files/Double%20Commander%20Source/doublecmd-0.5.7-src.tar.gz/download)


Данный граф строится программой в виде файла со структурой dot, который легко можно создать с помощью выгрузки отчета в файл с помощью параметра: