Архив рубрики 'Лингвистика'

Почему Телеграм такой неграмотный

Воскресенье, Январь 26th, 2020

Первого января 2020 года я написал радостную реплику: «Телеграм обновил spell checker — теперь ссылки на природную неграмотность не принимаются!.. Правда качество словаря пока оставляет желать лучшего: даже слово Телеграм он предлагает заменить на Телеграмм!!! Видимо, Дуров не нашёл ничего лучше, чем использовать старый словарь, который делал ещё Ашманов %)»

Сообщение это я запостил и в нашем канале в Телеграме, и в ФСБуке, где на него спустя три недели откликнулся сам Игорь Ашманов. И со свойственной ему эмоциональностью поделился не только своими впечатлениями, но и небезынтересными фактами и соображениями.

Привожу здесь наш диалог полностью и без малейших изменений:

Игорь Ашманов:

— Случайно нашёл этот пост спустя три недели. Какая чудовищная бредятина, Виктор. В лучших традициях ЕЖЕ.

1. Я не “использовал” никакой словарь (кроме печатного “Грамматического словаря”), я его сделал своими руками.

1а. Спелчекер - это НЕ словарь.

2. Словарь и спелчекер этот не старый, он обновляется каждый день.

3. Дуров не может его “использовать”, кто ж ему даст.

4. Он специально вызывал меня в Питер лет пять назад, долго - 5 часов, по кругу - уговаривал отдать ему ОРФО, но только даром, без упоминания и в исходниках. Естественно, ничего не получил. Потому что непонятно, зачем мне-то это было нужно.

5. Поэтому он, возможно, взял какую-то опенсорсную дрянь. И не обновлял её, как видно из случая с “телеграмм”.

Виктор Корб:

— Игорь Станиславович, удивлён вашим внезапным появлением тут :-) Вы восхищаете своей стабильностью.

Легко видеть, что я в точности написал, что вы сделали тот самый старый и самый первый словарь для автоматической проверки грамотности в Интернете. И, да, из моей реплики никак не следует то, что я мог перепутать словарь и спелчекер. Так что в первом пункте вы привычно спорите с воображаемым оппонентом.

За уточнения по остальным пунктам — спасибо. Это важные уточнения.

P.S. В ваших актуальных словарях таки тоже проскакивают смешные анахронизмы, то бишь словечки, либо отстающие от актуального состояния живаго великорусскаго, либо несущие на себе след лингвистического волюнтаризма. Но это тема отдельной содержательной дискуссии.

Игорь Ашманов:

— Они проскакивают, скорее всего, в словаре Microsoft Office, который застыл в развитии в 2011 году, когда Информатик продал ему словарь ОРФО в исходнике. С тех пор пути ОРФО и Офиса разошлись.

Кроме того, в спеллинг-чекере собственно словарём генерируется меньше половины всех словоформ, остальное - довольно сложные правила и алгоритмы генерации словоизменения и словообразования на лету.

Эти правила сейчас в Микрософте делают индусы, не знающие русского (возможно, там и есть русские лингвисты типа на полставки, осторожно предположу я, но управляют процессом индусы).

Надо понимать, что ВСЕ спелчекеры для русского сделаны на основе Грамматического словаря А.А. Зализняка. Только некоторые сделаны хорошо, как оРФО, а некоторые на отвяжись (как опенсорсные помойки вроде Дуровской).

А Грамматический словарь - это по преимуществу лексика 1950 и начала 1960 годов. Мне в 1987-1994 годах пришлось его пополнить минимум на 30-40% в общеязыковой части и долить ещё специальных терминов.

Машинное обучение тут не помогает.

Лингвистический волюнтаризм - это уже претензия не к Зализняку, а ко мне. Да, в некоторых неясных случаях, не охваченных ни Зализняком, ни Академическим словарём, ни словарём “Слитно или раздельно”, мне пришлось принимать решение, руководствуясь своим чувством языка и революционным правосознанием.

Тут нужно сказать, что создание массового продукта - всегда продукт волюнтаризма.
Например, что должно быть состоянием некоей функции в приложении на смартфоне или ПО на ноутбуке по дефолту - “включено” или “выключено”? То, что удобно 80% аудитории или 20%?

Очевидно, удобством 20% жертвуют - они изменят настройку, если неудобно.

Увы, в прикладной лингвистике таких компромиссов много.

Виктор Корб:

— Игорь, ещё раз премного благодарен за столь обстоятельный комментарий. Он и ещё раз подтвердил моё исходное предположение, и добавил точек над i :-)

Не возражаете, если я оформлю этот наш диалог отдельной заметкой, аккуратно процитировав обоих участников?

Игорь Ашманов:

— Как угодно. По возможности не надо резать по цитатам и оформлять дополнительными комментариями, на которые цитируемому оппоненту уже нельзя возразить.

Виктор Корб:

— Вообще не планировал ничего резать — лишь предварить аннотацией, вводящей в контекст. Интересно было бы конечно получить ещё и комментарий от команды Телеграма, но пока не получилось :-(

Когда не было блогеров

Суббота, Ноябрь 16th, 2019

Любопытный факт: безграмотное словечко распостранять было широко распространено задолго до появления слов пост и постинг из лексикона блогеров :-)

Рост темпов сокращения vs. Снижения темпов роста

Понедельник, Март 11th, 2019

Нас, заставших эпоху критики снижения темпов роста советской экономики от академика Абела Гезевича Аганбегяна, невозможно удивить подобными заголовками:

Тем более, что мы и сами их иногда используем. Вот, например, в 2017 году мы сообщали о том, что «спад на региональном рынке услуг продолжает замедляться» :-(

Я знаю, дело будет

Среда, Январь 30th, 2019

Сегодня получил очередное подтверждение того, что заказчики дела «ФСБ против Виктора Корба» не допустят его прекращения и не намерены не только снимать, но даже ослаблять плотный колпак вокруг «правозащитника-террориста»… Молчание ягнят лишь распаляет кровожадность хищников. И закон Нимёллера действует неукоснительно :-(

КОРБ КАК СТОМАХИН

Помните, я говорил, что заказчики дела «ФСБ против Корба» додумались до того, чтобы приписать мне авторство… стомахинских текстов? Вот, пожалуйста, следите за руками заказного подлого «эксперта», обосновавшего, что размещенный на сайте «Патриофил» документ — стенографическая расшифровка выступления Стомахина с последним словом в процессе по его третьему делу, — это на самом деле… «результат самостоятельного творчества определенного автора («KVV»), выражающего собственную точку зрения». Надо ли уточнять, что другие подлые заказные эксперты легко докажут, что аббревиатура KVV не может быть ничем иным, как Виктором Корбом, причем, именно в роли автора! Ч.Т.Д.

заказная экспертиза

Давно было сказано, что придут ко всем живым. И придут уже не с пресловутой 282, а с гораздо более жёсткой и манипулятивной 205.2… Ждите…

***

Кто-нибудь уже отмечал, что большинство гнусных заказов омского УФСБ выполняют сотрудники Омского ГПУ? Всё это было бы смешно, когда бы не было так мерзко :-(

***

Чекисты, похоже, окончательно решили показать, кто в России хозяин и по какому сценарию теперь будут действовать они.

Фантомные боли об Омске

Понедельник, Май 14th, 2018

Факты об Омске. Омские СМИ норовят запихнуть слово Омск в каждый заголовок, потому что соскучились по нему за годы правления Леонида Полежева, который ненавидел Омск до такой степени, что старался не упоминать его по имени, используя паллиативы вроде «областного центра Прииртышья».

Фейсбук.

Несуразности

Пятница, Февраль 16th, 2018

Как-то не по себе становится, когда получаешь уведомление о том, что твой умерший знакомый just joined Telegram. Понятно, что просто номер попал к другому человеку, но ведь по факту это уведомление ложное. Можно было хотя бы добавить слово «возможно»…

***

Спелчекер до сих пор считает слово биткоин неправильным и предлагает заменить его на Биткина или Кибиткина… Впрочем, слово спелчекер он тоже считает неправильным ))) А вариант спелл-чекер, рекомендованный Википедией и Орфографическим словарем 1999 года, мне совсем не нравится.

***

Вы на выборах администрации в концлагере тоже пытались бы выбрать наименее злого вертухая? И независимое наблюдение за прозрачностью и демократичностью процедуры выборов поддержали бы?.. Нет? А в чем принципиальная разница?

Задонатить

Понедельник, Ноябрь 27th, 2017

— Если вы готовы помочь, задонатьте нам, — обращаются с призывом активисты Протестной Москвы (@nedimon_msk)…

ЗАДОНАТИТЬ — это от английского donate (дарить, жертвовать), если кто сходу не понял, не въехал, не врубился и не вкурил ;-)

Дело Стомахина

Четверг, Март 31st, 2016

И ведь никто не удивится, если в России станут раскручивать “Дело Стомахина”, приплетя туда всех репостеров и всех защитников свободы слова.

Если Корб решил учить немецкий…

Вторник, Февраль 2nd, 2016

Сын-студент сообщает из #NewYork: «Продолжаю учить немецкий. У преподавателя тоже фамилия Корб — он страшно обрадовался такому совпадению».

Все языки имеют общий корень

Вторник, Февраль 2nd, 2016

Поступают подтверждения моих лингвистических гипотез, до серьезной проверки которых и выстраивания теории у меня так и не дошли руки :-) Любопытно было бы ознакомиться с оригинальными материалами этих исследований…

Напомню, по моей ключевой гипотезе все языки имеют общие древние пра-корни, представляющие собой двух и даже односложные морфемы, то есть, минимальные фонетические единицы, несущие базовые смыслы, инвариантные по отношению к большинству внешних условий, поскольку они опосредованы физиолого-анатомическими особенностями речевого аппарата человека. Например, РК (РС, РЧ) имеет базовое значение крюк (рог), Н - новое, С - текущее, Т - точка, стояние, Р - природное, Б - живое, свое…

Восстановление таких базовых корней из современных слов разных языков может уточнить представление об их происхождении и развитии.

UPD: Коллеги тут совершенно справедливо подсказывают, что указанное выше исследование посвящено, мягко говоря, другому аспекту языкового сходства, а именно феномену “сходства структуры лексической семантики“. Так что можно это воспринимать лишь как дополнительный аргумент в гипотезу об общем происхождении большинства современных языков.

Ниочомск

Суббота, Декабрь 19th, 2015

Ещё одно имя…

КНБС

Понедельник, Декабрь 14th, 2015

Слова Конфуций и Каннабис имеют очевидную сходную фонематическую основу — СН-БС или Сын-Баши (Хан-Баши), или Сын Бога…

Почти по Далю

Вторник, Ноябрь 24th, 2015

Давно подмывает уточнить у моих коллег из Питера: “Правда ли, что в Санкт-Петербурге бордели называют поебликами, или это добрый анекдот?” ;)

В языкознанье они знали толк

Воскресенье, Октябрь 4th, 2015

Филологи на Радио России признались,
что одним из “достижений” ГДР стало
появление “гэдээровского языка” -
немецкого, замусоренного совком.

04.10.15

Фольцваген vs Фольксваген

Вторник, Сентябрь 22nd, 2015

Да, кстати, я, кажется, пропустил важное:
а давно всем российским журналистам
уже разрешили произносить
“ФОЛЬЦВАГЕН”, вместо “Фольксваген”?

22.09.15

За далью Даль отдыхает

Вторник, Сентябрь 8th, 2015

Настенный словарь
живого великорусского языка.

Пизда-вагина

08.09.15

Низкая различительная способность

Воскресенье, Август 30th, 2015

Журналисты не различают фразы
“В Средиземном море открыто
крупнейшее месторождение”
и “Открыто крупнейшее
в Средиземном море месторождение”.

30.08.15

Мощь слова

Среда, Август 26th, 2015

И Сенцов, и Савченко, и Стомахин -
заложники путинской России.
Но первые страдают “за дела”,
хоть и неправосудно, Стомахин - лишь за слово.

В рейтинге “Сила слова”
политзек Борис Стомахин - безусловный лидер:
за одну лишь жесткую ненасильственную
критику режима он получил 12 лет!

26.08.15

Sputnik, Pogrom & Shubokhranilischche

Пятница, Август 21st, 2015

Новое русское слово #shubokhranilischche
пополнило набор великих
заимствований из русского языка -
в дополнение к словам #sputnik и #pogrom.

21.08.15

P.S. Оказывается, сочетание “Спутник и погром”
первым использовал Борис Стомахин
в далеком 2007 году?

Грамматические разногласия

Пятница, Июль 24th, 2015

Ксюша Собчак ставит пробелы
перед запятыми, а после них не ставит.
Это всё, что вам достаточно знать
об этом “лидере российской оппозиции”.

24.07.15