Иероглифы в гугле. От идеи в Google Keep до черновика в Google Docs

Для Андроид 10.04.2019
Для Андроид

Здравствуйте, уважаемые читатели, почитатели и прочие хорошие люди!

Случалось ли Вам получать и читать письма на “фиг каком пойми языке” или заходить на какой-нибудь интернет-ресурс и вместо привычных букв видеть сплошные кракозябры? Если да, тогда эта заметка для Вас, ибо в ней мы поговорим о кодировке страниц, её форматах, почему оная возникает и как впредь избежать непонятных иероглифов.

Итак, сегодня нас ждет не легкая софтовая статья, а суровая техническая, так что приготовьтесь: будем немного ударяться в суровые реалии.
Поехали.

Что такое кодировка текста и с чем ее едят?

Начать хотелось бы с того, что этой статьи могло бы и не быть, т.к. компьютерно-юзательная жизнь автора этих строк протекала вполне себе спокойно и достойно. Но вот в один прекрасный день, шляясь по просторам сети Интернет не со своего ПК, я столкнулся с непонятными явлениями на некоторых сайтах. Заходя на интернет-ресурсы, я видел не привычный нам русский алфавит и красивый понятный текст, а какую-то ересь в виде непонятной последовательности символов. Выглядела она примерно вот так (см. изображение).

Сначала я подумал, что моя любимая Мозилка (браузер Firefox) перегрелась и ей пора вызывать неотложку, но потом начал понимать, что проблема, скорее всего, на стороне ресурса сети и кроется она в неправильно настроенной кодировке. Это действительно оказалось так, и пошаманив немного с бубном, проблемка была оперативно решена. Результатом же всех моих любовных похождений и стал сегодняшний материал. Собственно, поехали разбираться в деталях.

Всю информацию, представленную в цифровом виде и находящуюся в глобальной паутине, нужно рассматривать с двух сторон: первая - со стороны пользователя (красивый и ухоженный текст на экране монитора) и вторая – со стороны поисковой машины (некий программный код, состоящий из различных тегов/метатегов, таблицы символов и прочее).

Если Вы хоть немного знакомы с языком разметки гипертекста (HTML ), то должны быть в курсе, что сайт глазами поисковых машин (Google, Яндекс ) видится не как обычный текст, а как структурированный документ, состоящий из последовательностей различного рода тегов. Чтобы было понятней, о чем я говорю, давайте взглянем на всеми нами любимый сайт Заметки Сис.Админа ” проекта [Sonikelf"s Project"s ], но не глазами обычного пользователя, а "глазами" поисковика. Для этого нажимаем сочетание клавиш Сtrl+U (для браузеров Firefox и Chrome ) и видим следующую картину (см. изображение):

Перед нами машинный вариант сайт , вот в таком вот непрезентабельном виде он подается поисковым системам и именно в таком виде они его и кушают. Если бы мы просто взяли и “засандалили” варианты статей из блокнота или Word обычным текстом, машины бы им не то что подавились, они бы даже и есть его не стали. Итак, перед нами главная страница проекта в HTML -виде. Обратите внимание на строку с надписью UTF-8 , это не что иное, как пресловутая кодировка текста страницы, именно она и отвечает за формат вывода информации в презентабельном виде, в результате чего через браузер мы видим нормальный текст.

Теперь давайте разберемся, почему же происходит так, что порой на экране монитора мы видим кракозябры. Все очень просто, проблема кроется в открытии файла в неверной кодировке. Если перевести на бытовой язык, то допустим Вас послали в магазин за молоком, а Вы притарабанили хлеб, вроде бы тоже съестное, но совсем другой формат продукта.

Итак, теперь давайте разбираться с теорией и для этого введем некоторые определения.

  1. Кодировка (или “Charset ”) – соответствие набора символов набору числовых значений. Нужна для “сливания” информации в интернет, т.е. текстовая информация преобразуется в биты данных;
  2. Кодовая страница (“Codepage ”) – 1 байтовая (8 бит) кодировка;
  3. Количество значений, принимаемое 1 байтом – 256 (два в восьмой).

Соответствие “символ-изображение” задается с помощью специальных кодовых таблиц, где каждому символу уже присвоен свой конкретный числовой код. Таких таблиц существует достаточно много, и в разных таблицах один и тот же символ может идентифицироваться по-разному (ему могут соответствовать разные числовые коды).

Хотите знать и уметь, больше и сами?

Мы предлагаем Вам обучение по направлениям: компьютеры, программы, администрирование, сервера, сети, сайтостроение, SEO и другое. Узнайте подробности сейчас!

Все кодировки различаются количеством байт и набором специальных знаков, в которые преобразуется каждый символ исходного текста.

Примечание:
Декодирование – операция, в результате которой происходит преобразование кода символа в изображение. В результате этой операции информация выводится на экран монитора пользователя.

В общем.. С определениями разобрались, а теперь давайте узнаем, какие же (кодировки) бывают.

Виды кодировок текста

А их, в общем-то, хватает.

  • ASCII

Одной из самых “древних” считается американская кодировочная таблица (ASCII , читается как “аски”), принятая национальным институтом стандартов. Для кодировки она использовала 7 битов, в первых 128 значениях размещался английский алфавит (в нижнем и верхнем регистрах), а также знаки, цифры и символы. Она больше подходила для англоязычных пользователей и не была универсальной.

  • Кириллица

Отечественный вариант кодировки, для которого стали использовать вторую часть кодовой таблицы – символы с 129 по 256 . Заточена под русскоязычную аудиторию.

  • Кодировки семейства MS Windows : Windows 1250-1258 .

8-битные кодировки, появились как следствие разработки самой популярной операционной системы, Windows . Номера с 1250 по 1258 указывают на язык, под который они заточены, например, 1250 – для языков центральной Европы; 1251 – кириллический алфавит.

  • Код обмена информацией 8 бит – КОИ8

KOI8-R, KOI8-U, KOI-7 – стандарт для русской кириллицы в юникс-подобных операционных системах.

  • Юникод (Unicode )

Универсальный стандарт кодирования символов, позволяющий описать знаки практически всех письменных языков. Обозначение “U+xxxx ” (хххх – 16-ричные цифры). Самые распространенные семейства кодировок UTF (Unicode Transformation Format) : UTF-8, 16, 32 .

В настоящее время, как говорится, “рулит” UTF-8 – именно она обеспечивают наилучшую совместимость со старыми ОС , которые использовали 8 -битные символы. В UTF-8 кодировке находятся большинство сайтов в сети Интернет и именно этот стандарт является универсальным (поддержка кириллицы и латиницы).

Разумеется, я привел не все виды кодировок, а только наиболее ходовые. Если же Вы хотите для общего развития знать их все, то полный список можно отыскать в самом браузере. Для этого достаточно пройти в нем на вкладку “Вид-Кодировка-Выбрать список ” и ознакомиться со всевозможными их вариантами (см. изображение).

Думаю возник резонный вопрос: “Какого лешего столько кодировок? ”. Их изобилие и причины возникновения можно сравнить с таким явлением, как кроссбраузерность/кроссплатформенность. Это когда один и тот же сайт сайт отображается по-разному в различных интернет-обозревателях и на различных гаджет-устройствах. Кстати у сайта "Заметки Сис.Админа " с этим, как Вы заметили всё в порядке:).

Все эти кодировки – рабочие варианты, созданные разработчиками “под себя” и решение своих задач. Когда же их количество перевалило за все разумные пределы, а в поисковиках стали плодиться запросы типа: “Как убрать кракозябры в браузере? ” - разработчики стали ломать голову над приведением всей этой каши к единому стандарту, чтобы, так сказать, всем было хорошо. И кодировка Unicode , в общем-то, это “хорошо” и сделала. Теперь если такие проблемы и возникают, то они носят локальный характер, и не знают как их исправить только совсем непросвещенные пользователи (впрочем, часто беда с кодировкой и отображением сайтов появляется из-за того, что веб-мастер указал на стороне сервера некорректный формат, и приходится переключать кодировку в браузере).

Ну вот, собственно, пока вся "базово необходимая" теория, которая позволит Вам “не плавать” в кодировочных вопросах, теперь переходим к практической части статьи.

Решаем проблемы с кодировкой или как убрать кракозябры?

Итак, наша статья была бы неполной, если бы мы не затронули пользовательско-бытовые вопросы. Давайте их и рассмотрим и начнем с того, как (с помощью чего) можно посмотреть кодировку?

В любой операционной системе имеется таблица символов, ее не нужно докачивать, устанавливать – это данность свыше, которая располагается по адресу: “Пуск-программы-стандартные-служебные-таблица символов”. Это таблица векторных форм всех установленных в Вашей операционной системе шрифтов.

Выбрав “дополнительные параметры” (набор Unicode ) и соответствующий тип начертания шрифта, Вы увидите полный набор символов, в него входящих. Кликнув по любому символу, Вы увидите его код в формате UTF-16 , состоящий из 4 шестнадцатеричных цифр (см. изображение).

Теперь пара слов о том, как убрать кракозябры. Они могут возникать в двух случаях:

  1. Со стороны пользователя - при чтении информации в интернет (например, при заходе на сайт);
  2. Или, как говорилось чуть выше, со стороны веб-мастера (например, при создании/редактировании текстовых файлов с поддержкой синтаксиса языков программирования в программе ++ или из-за указания неправильной кодировки в коде сайта).

Рассмотрим оба варианта.

№1. Иероглифы со стороны пользователя.
Допустим, Вы запустили ОС и в каком-то из приложений у Вас отображаются пресловутые каракули. Чтобы это исправить, идем по адресу: “Пуск - Панель управления - Язык и региональные стандарты - Изменение языка ” и выбираем из списка, "Россия ".

Также проверьте во всех вкладках, чтобы локализация была “Россия/русский ” – это так называемая системная локаль.

Если Вы открыли сайт и вдруг поняли, что почитать информацию Вам не дают иероглифы, тогда стоит поменять кодировку средствами браузера (“Вид - Кодировка ”). На какую? Тут все зависит от вида этих кракозябр. Ориентируйтесь на следующую шпаргалку (см. изображение).

№2. Иероглифы со стороны веб-мастера.
Очень часто начинающие разработчики сайтов не придают большого значения кодировке создаваемого документа, в результате чего потом и сталкиваются с вышеозначенной проблемой. Вот несколько простых базовых советов для веб-мастеров, чтобы исправить беду.

Чтобы такого не происходило, заходим в редактор Notepad++ и выбираем в меню пункт “Кодировки ”. Именно он поможет преобразовать имеющийся документ. Спрашивается, какой? Чаще всего (если сайт на WordPress или Joomla ), то “Преобразовать в UTF-8 без BOM ” (см. изображение).

Сделав такое преобразование, Вы увидите изменения в строке статуса программы.

Также во избежание кракозябр необходимо принудительно прописать информацию о кодировке в шапке сайта. Тем самым Вы укажите браузеру на то, что сайт стоит считывать именно в прописанной кодировке. Начинающему веб-мастеру необходимо понимать, что чехарда с кодировкой чаще всего возникает из-за несоответствия настроек сервера настройкам сайта, т.е. на сервере в базе данных прописана одна кодировка, а сайт отдает страницы в браузер в совершенной другой.

Для этого необходимо прописать “внаглую” (в шапку сайта, т.е, как частенько, в файл header.php ) между тегами <head> </head> следующую строчку:

Прописав такую строчку, Вы заставите браузер правильно интерпретировать кодировку, и иероглифы пропадут.

Также может потребоваться корректировка вывода данных из БД (MySQL). Делается сие так:

mysql_query("SET NAMES utf8");
myqsl_query("SET CHARACTER SET utf8");
mysql_query("SET COLLATION_CONNECTION="utf8_general_ci"" ");

Как вариант, можно еще сделать ход конём и прописать в файл .htaccess такие вот строчки:

# BEGIN UTF8
AddDefaultCharset utf-8
AddCharset utf-8 *

CharsetSourceEnc utf-8
CharsetDefault utf-8

# END UTF8

Все вышеприведенные методы (или некоторые из них), скорее всего, помогут Вам и Вашим будущим посетителям избавиться от ненавистных иероглифов и проблем с кодировкой. К сожалению, более подробно мы здесь инструкцию по веб-мастерским штукам рассматривать не будем, думаю, что они обязательно разберутся в подробностях при желании (как-никак у нас несколько другая тематика сайта).

Ну, вот и практическая часть статьи закончена, осталось подвести небольшие итоги.

Послесловие

Сегодня мы познакомились с таким понятием, как кодировка текста. Уверен, теперь при возникновении каракулей на мониторе компьютера Вы не спасуете, а вспомните все приведенные здесь методы и решите вопрос в свою пользу!

На сим все, спасибо за внимание и до новых встреч.

Радостно бежала к компьютеру, чтобы рассказать миру о своём открытии. Оказалось, я не первая Ну что ж) Пообещала себе не читать ни одного отзыва из этой ветки, пока не напишу свой. Так что будьте уверены - это не рерайт и не плагиат. Ко всему пришла сама. Офигеть гений

Японскую, корейскую и даже китайскую косметику любят, особенно на Irecommend. Однако при написании отзыва или выборе товара камнем преткновения может стать отсутствие наклейки с переводом состава. Авторы обычно понуро разводят руками: дескать, нет описания на английском, звиняйте. Раньше и я такой была. А потом меня осенило, что наверняка в 21 веке найдётся способ распознать иероглифы. И кто нам тут поможет, как не всемогущий Гугл?

Итак, знакомимся - приложение Google Переводчик для Андроид Для iOS и Windows Phone, я уверена, тоже есть версия.

Где найти? В моём случае, конечно, это Play Market. В случае других ОС - аналогичные магазины приложений.

Цена: приложение полностью бесплатно, но показывает нам рекламу. Отключить её за деньги нет возможности. (Поправьте меня, если я не права)

Функционал: приложение умеет распознавать и переводить текст:

  • в печатном виде - классика, всё работает на отлично. Главное - помнить, что лучше переводить отдельные слова, а не целые предложения;
  • в рукописном виде - для моих кривых лапок не самый удобный способ. Лично мне проще напечатать;
  • с микрофона : если по-русски гугл меня ещё понимает, то на моём корявом английском максимум можно произнести «Hello! How are you?». Даже фразу «I Recommend» я произношу как-то не так xD

Можно просто сфотографировать текст с упаковки средства, можно скачать фотографию или сделать скриншот (так я делаю, когда в отзывах сфотографированы только иероглифы. Спасибо тем, кто снимает состав, даже не собираясь заниматься его разбором ).

Есть ещё такая забавная вещь, как мгновенный перевод . Вы только навели камеру на коробочку, и тут же на ваших глазах корейский, к примеру, язык превращается в английский. Выглядит как какая-то чертовщина

Пошагово рассказываю , как перевести иероглифы с картинки на понятный нам язык. В роли иероглифов выступает корейский язык, в котором на самом-то деле не иероглифы, а алфавит. Но согласитесь, что нам, простым обывателям, всё то, что далеко от латиницы и кириллицы - иероглифы Итак, распознаём корейский текст.

1. На главном экране приложения нужно выбрать язык. Так как я обычно интересуюсь составом средства, мне привычнее видеть его на английском языке.

2. Нажимаем на кнопку в виде фотоаппарата.

3. Фокусируемся на нужной области, снимаем.

4. На следующем экране выделяем текст. Я обычно пользуюсь кнопкой «Выделить всё».

5. Появляется кусок переведённого текста со стрелкой. Нажимаем на него, чтобы просмотреть текст полностью. На этом экране можно копировать текст в буфер обмена и делать с ним что душе угодно.


Так, например, я узнала, что моя краска для волос , несмотря на технологию окрашивания, не подразумевающую использование окислителя, содержит гидроксид аммония о_О Текст со скрина выше:

Ingredients: purified water, ethanol, glycollic acid benzyl alcohol, methylpyrrolidone, glycerin, propylene glycol, hydroxycellulose cellulose, ammonium hydroxide , nonoxy 12, hydrolyzed collagen, (T), color No. 401 (t), purple color No. 401 (t), orange color No. 401 (t) Yellow No. 403-1 (Red, No. 401, No. 227, Red No. 201, Yellow No. 4, Red No. 106, Blue No. 1, Purified water, ethanol, glycerin, glycol distearate pigment-12 dimethicone, benzyl alcohol, methylpyrrolidone settimonium chloride, polyquaternium-10, hydroxyethyl cellulose Acid, panthenol, wenna extract, Isothiazolinone / methyl isothiazolinone, fragrance.

Вернёмся к приложению . Оно полезное, но какие же я обнаружила минусы ?

  • Несмотря на обширную базу языков, там отсутствует, к примеру, татарский . Обидно, знаете ли! А вдруг я приехала в Казань и ломаю голову над тем, что такое бәдрәф? В этом случае придётся применить аналогичный сервис от Яндекса. Который, кстати, не умеет распознавать корейский текст.
  • Также не для всех языков, символы которых отсутствуют на стандартных клавиатурах, есть функция распознавания текста по фото. Например, «щёлкнуть» грузинский и тайский текст вы не сможете.

В остальном - отличная штука. Кто ещё не знает, что налито в его азиатских баночках - настоятельно рекомендую Google переводчик для мобильного

2006 год стал вехой в истории Google: Оксфордский словарь английского языка принял слово «гуглить». Понятие стало нарицательным. С тех пор искать в Сети - значит гуглить. «Корпорация добра» сильно влияет на наше поведение в интернете: мы следуем деловому этикету Gmail, открываем окно в мир, запуская Chrome каждое утро, и используем Google Drive для продуктивной работы.

Причина популярности «Google Документов» в облачном принципе работы. Из всех инструментов «Google Диска» текстовый редактор самый необходимый для выполнения повседневных задач.

Чтобы сделать работу с «Google Документами» более продуктивной, используйте следующие десять рекомендаций.

Бонус: добавьте Google Docs в меню запуска на панели задач Windows или Mac. Два клика - и вы в «Документах».

Быстрый поиск

Найти тот или иной файл или папку можно легко и быстро, если ввести ключевую фразу в строку поиска вверху. Маленькая стрелочка справа поможет уточнить критерии поиска:

  • тип файла (папка, документ, фотография, PDF и так далее);
  • открыть с помощью Google Docs, Google Drawing, Google Sheets, любым установленным аддоном;
  • владелец (я, не я, кто угодно).

Ещё одна штука, упрощающая поиск, - использование точной цитаты, относящейся к файлу, который хотите найти. Google Drive откроет документ и подсветит использованную поисковую фразу. Кроме того, как и при гуглении, можно применять булевы операторы вроде or для расширения границ поиска.

Нажмите «/» для перехода в поле поиска.

Полный список поисковых опций «Google Диска» смотрите . И последнее: не забывайте искать в корзине.

Быстрый переход в меню «скрытых» команд

Google Docs похож на другие офисные пакеты. Возможно, он попроще Microsoft Word, но в меню тоже множество полезных команд. Нажмите «Alt + /», чтобы перейти к поиску по меню. Введите в открывшемся поле то, что ищите, и функция запустится.

При помощи поиска по меню можно обнаружить и другие инструменты редактирования, имеющиеся в Google Docs.

От идеи в Google Keep до черновика в Google Docs

Прекрасный сервис для создания и хранения заметок. Его лучшие функции: возможность надиктовывать заметки и распознавать текст с фотографий. Но знаете ли вы, что можно в один клик заметку превратить в документ?

Благодаря такому экспорту можно редактировать и «полировать» свои идеи уже в Google Docs. Незаменимо для студентов и пишущих людей - немало экономит время.

Анализируем свой словарный запас с Word Cloud

Копирайтеры, блогеры, студенты и преподаватели могут использовать облако слов или облако тегов, чтобы быстро сориентироваться в содержании документа. Также это поможет увидеть, какими словами вы злоупотребляете.

Использовать генератор облака слов - Tag Cloud Generator - можно в любом документе, состоящем из 50 и более слов. Бесплатное Google-Drive-дополнение можно найти и установить из меню Add-ons → Get Add-ons…

Пользоваться облаком слов можно через то же меню. Оно будет отображаться в маленьком окне справа. Если документ не окончен, вы продолжаете редактирование, то время от времени нажимайте кнопку Refresh Cloud, чтобы обновлять облако тегов.

Tag Cloud Generator работает также в таблицах. Единственный минус - панель, где отображаются употребляемые слова, нельзя масштабировать.

Найти и вставить в один клик

Благодаря инструменту Research вам не нужно покидать документ, в котором работаете, чтобы загуглить какую-то информацию. Ведь открытие новой вкладки в браузере тоже занимает время. Это встроенный инструмент позволяет находить и вставлять информацию в используемый документ или таблицу. Откройте Tools → Research (Ctrl + Alt + Shift + I).

Справа появится окно поиска. Там вы сможете в один клик поставить ссылку на цитату, вписав её вручную или просто выделив.

Доступные форматы цитирования: MLA, APA и Chicago.

Причём красиво обрамлённые цитаты - только одна из фишек Research Tool. Ещё можно ссылаться на статистические данные в таблицах. При использовании поиска можно также персонализировать выдачу, чтобы отображались ваши публикации в Google+, ваши письма и так далее. Для всего этого есть специальные фильтры.

Быстрое форматирование текста в разных местах

В Google Docs есть инструмент Paint format, который позволяет создавать шаблоны форматирования и применять их к любому участку текста. Выделите слово, предложение или любой другой фрагмент текста, отредактируйте его: задайте размер, шрифт и прочее. Затем нажмите Paint format. После этого вы сможете применить заданные параметры форматирования к другому фрагменту, стоит лишь кликнуть на него.

«Пфф! Это работает только один раз!» - скажут скептики. Если нужно применить заданные параметры форматирования больше одного раза, кликните по иконке Paint format дважды. Чтобы «волшебство» прекратило действовать, вновь нажмите эту кнопку.

Использование royalty-free-картинок

Google Docs включает в себя поиск по «Картинкам Google», что позволяет оперативно находить и вставлять изображение в документ. Но есть ещё два богатых источника картинок - это LIFE и Stock Photos. Изображения из архива LIFE имеют лицензию, дающую право использовать произведение даже коммерчески, но нужно обязательно указывать авторство. В 2012 году Google отобрал пять тысяч новых фото в категориях «Природа», «Погода», «Животные», «Спорт», «Еда», «Образование», «Технологии», «Музыка» и других.

Google предупреждает, что картинки доступны для личного и коммерческого пользования только внутри Google Drive и должны использоваться в рамках политики сервиса.

Можно вставлять картинки с помощью URL. Изображение сохранится в вашем документе и будет доступно, даже если оригинал удалят из Сети.

Упоминание кого-то при комментировании

Совместная работа в «Google Документах» строится на комментировании. При этом есть быстрый способ обратить внимание человека на определённый комментарий. Выделите нужный фрагмент текста и нажмите «добавить комментарий» (Insert → Comment). В открывшимся поле для комментирования впишите «@» или «+» и начните вводить имя нужного человека.

Google Docs автоматически выберет персону из вашего списка контактов Gmail и проинформирует её по email. Если у этого человека нет прав для просмотра данного документа, вам нужно дать ему доступ.

Шорткаты для математических формул

В Google Docs есть удобный редактор математических выражений: Insert → Equation. При помощи него можно не только набирать математические выражения, но и удобно работать над ними с коллегами.

Чтобы ускорить процесс, пользуйтесь шорткатами. Например, если вы введёте «\alpha» с последующим пробелом и скобкой, Google Docs конвертирует это в символ α. Также вы сможете легко добавлять верхний или нижний индекс, вводя соответственно «^» и «_». Для дробей введите «\frac».

Полный список шорткатов для математических выражений . Для создания более сложных формул используйте бесплатное расширение g(math) Google Drive для Chrome.

Другие шорткаты для экономии времени

Нажмите «Ctrl + /» и увидите большой список шаблонов для быстрого управления документом. Многие навигационные клавиши совпадают с Gmail. Кроме того, можно создавать собственные шорткаты.

Перейдите в Tools → Preferences → Automatic Substitution.

Вы можете использовать это для автоматической вставки часто используемых слов, email-адресов, аббревиатур или даже слов, в которых постоянно делаете опечатки.

Также необходимо отметить «Автоматическое определение ссылок» и «Автоматическое определение списков» в диалоговом окне настроек.

Конечно, вы можете возразить, что самый быстрый способ создать красивый документ - использовать . Но описанные маленькие хитрости помогут ускорить работу и с ними.

Пишите в комментариях, какими трюками пользуетесь вы в повседневной работе с «Google Документами».



Рекомендуем почитать

Наверх