Мэчить что это данные
Мэтчинг
Ещё один термин, пришедший к нам из английского языка. И ещё один из тех терминов, которыми так любят кидаться ультрасовременные и, как им самим, наверное, кажется, жутко модные трейдеры, брокеры, рекрутёры, игроки и много ещё кто. Дело в том, что данный термин можно отнести к множеству сфер деятельности от теории игр до найма персонала, а потому и услышать его можно где угодно и от кого угодно.
На самом деле, в этом слове нет ничего заумного. Банальный перевод с английского языка в Google Translate говорит нам о том, что мэтчинг (от англ. matching) по-русски означает не что иное, как согласование. То есть, когда речь идёт о стыке каких либо объектов или величин в плане их соответствия друг с другом (покупки и продажи, подрядчика и заказчика и даже мужчины и женщины), можно смело использовать слово мэтчинг.
В экономике, словом мэтчинг принято описывать поведение экономических агентов, в результате которого получается одновременный взаимный выбор ими друг друга. Это поведение можно описать, так называемой задачей о марьяже, за решение которой, между прочим, была присвоена Нобелевская премия по экономике за 2012 год.
Решение этой задачи было предложено математиками Дэвидом Гейлом и Ллойдом Шепли и в настоящее время широко используется в таких видах деятельности как набор клиниками врачей и интернов, набор спортсменов в команды, набор сотрудников и т.п.
Ну а что касается нашей тематики, а вы сейчас находитесь на страницах интернет-журнала для трейдеров и инвесторов, то термин мэтчинг применяется здесь в двух основных значениях:
Кроме этого, есть такое понятие как электронный мэтчинг. С его помощью, в частности, упрощаются расчёты по ценным бумагам внутри депозитария. Для клиентов депозитария использование электронного мэтчинга даёт следующие основные преимущества:
Архив: Смэтчить данные (найти наиболее похожие друг на друга данные)
1500 анализов. Данные, которые доступны про каждый анализ: название + биоматериал. Что такое одинаковые анализы?Необходимое условие:Биоматериалы анализов совпадают, т.е., например, анализы являются одинаковыми, если их биоматериалом является сыворотка крови или кровь с ЭДТА. Примечание 1: есть одна лаборатория (CMD), у которой не прописано, что это точно за биоматериал, а прописано только общими словами, например, кровь (в случае с этой лабораторией достаточно совпадения биоматериала с точностью до смысла, т.е. ”кровь” = ”кровь с ЭДТА” или ”кровь” = ”кровь с натрием”)Примечание 2: биоматериалы у разных лабораторий могут называться по-разному, например, ”кровь с ЭДТА” или ”кровь (ЭДТА)”, но у одной лаборатории названия одинаковых биоматериалов идентичны (я понимаю, что очень легко было привести к единому виду в excel, но у меня как назло полетел офис)Достаточное условие:а) анализы, называющиеся одинаковоб) анализы, называющиеся немного по-разному, но обозначающие одно и то же Примеры одинаковых анализов:1) Антитела к кардиолипину (Anticardiolipin antibodies) класса IgM, сыворотка крови
2) Антитела к кардиолипину IgM (Антикардиолипиновые антитела IgM, АКЛ IgM, Cardiolipin Antibodies IgM, aCL antibody IgM, APAs IgM), кровь3) Антитела к кардиолипину, IgM, сыворотка крови1) Исследование соскобов с шейки матки и цервикального канала, мазок2) Исследование соскобов шейки матки и цервикального канала (Examination of Scrapings: Cervix and Cervical Canal ), мазок из влагалища1) Кобальт (моча), моча2) Кобальт в моче (Cobalt), мочаКак предполагается искать одинаковые анализы?Поиск конкретных методы метчинга всегда ваш выбор, но мне кажется, что наиболее эффективно делать следующим образом: искать по словам и/или символам те, которые максимально друг с другом совпадают, а далее руками проверять, действительно ли они одинаковыеВ каком формате хочется увидеть результат?https://docs.google.com/spreadsheets/d/1I9qBzMNoUzLd5WXuo6J1LA70mDEKVVlCaYbkzjfmjQw/edit?usp=sharingЧто является критерием достижения результата?1) Я бы хотела, чтобы
70% анализов каждой лаборатории было найдено соответствие хотя бы в двух лабораториях. При этом, этот процент может меняться от лаборатории к лаборатории. Например, у одной лабы
500 видов анализов, поэтому совершенно точно для 90% можно найти соответствующий хотя бы в одной лаборатории.У другой лаборатории
Чудеса хеширования
Криптографические хеш-функции — незаменимый и повсеместно распространенный инструмент, используемый для выполнения целого ряда задач, включая аутентификацию, защиту файлов и даже обнаружение зловредного ПО. Как они работают и где применяются?
Криптографические хеш-функции — незаменимый и повсеместно распространенный инструмент, используемый для выполнения целого ряда задач, включая аутентификацию, проверку целостности данных, защиту файлов и даже обнаружение зловредного ПО. Существует масса алгоритмов хеширования, отличающихся криптостойкостью, сложностью, разрядностью и другими свойствами. Считается, что идея хеширования принадлежит сотруднику IBM, появилась около 50 лет назад и с тех пор не претерпела принципиальных изменений. Зато в наши дни хеширование обрело массу новых свойств и используется в очень многих областях информационных технологий.
Что такое хеш?
Если коротко, то криптографическая хеш-функция, чаще называемая просто хешем, — это математический алгоритм, преобразовывающий произвольный массив данных в состоящую из букв и цифр строку фиксированной длины. Причем при условии использования того же типа хеша длина эта будет оставаться неизменной, вне зависимости от объема вводных данных. Криптостойкой хеш-функция может быть только в том случае, если выполняются главные требования: стойкость к восстановлению хешируемых данных и стойкость к коллизиям, то есть образованию из двух разных массивов данных двух одинаковых значений хеша. Интересно, что под данные требования формально не подпадает ни один из существующих алгоритмов, поскольку нахождение обратного хешу значения — вопрос лишь вычислительных мощностей. По факту же в случае с некоторыми особо продвинутыми алгоритмами этот процесс может занимать чудовищно много времени.
Как работает хеш?
Например, мое имя — Brian — после преобразования хеш-функцией SHA-1 (одной из самых распространенных наряду с MD5 и SHA-2) при помощи онлайн-генератора будет выглядеть так: 75c450c3f963befb912ee79f0b63e563652780f0. Как вам скажет, наверное, любой другой Брайан, данное имя нередко пишут с ошибкой, что в итоге превращает его в слово brain (мозг). Это настолько частая опечатка, что однажды я даже получил настоящие водительские права, на которых вместо моего имени красовалось Brain Donohue. Впрочем, это уже другая история. Так вот, если снова воспользоваться алгоритмом SHA-1, то слово Brain трансформируется в строку 97fb724268c2de1e6432d3816239463a6aaf8450. Как видите, результаты значительно отличаются друг от друга, даже несмотря на то, что разница между моим именем и названием органа центральной нервной системы заключается лишь в последовательности написания двух гласных. Более того, если я преобразую тем же алгоритмом собственное имя, но написанное уже со строчной буквы, то результат все равно не будет иметь ничего общего с двумя предыдущими: 760e7dab2836853c63805033e514668301fa9c47.
Впрочем, кое-что общее у них все же есть: каждая строка имеет длину ровно 40 символов. Казалось бы, ничего удивительного, ведь все введенные мною слова также имели одинаковую длину — 5 букв. Однако если вы захешируете весь предыдущий абзац целиком, то все равно получите последовательность, состоящую ровно из 40 символов: c5e7346089419bb4ab47aaa61ef3755d122826e2. То есть 1128 символов, включая пробелы, были ужаты до строки той же длины, что и пятибуквенное слово. То же самое произойдет даже с полным собранием сочинений Уильяма Шекспира: на выходе вы получите строку из 40 букв и цифр. При всем этом не может существовать двух разных массивов данных, которые преобразовывались бы в одинаковый хеш.
Вот как это выглядит, если изобразить все вышесказанное в виде схемы:
Для чего используется хеш?
Отличный вопрос. Однако ответ не так прост, поскольку криптохеши используются для огромного количества вещей.
Для нас с вами, простых пользователей, наиболее распространенная область применения хеширования — хранение паролей. К примеру, если вы забыли пароль к какому-либо онлайн-сервису, скорее всего, придется воспользоваться функцией восстановления пароля. В этом случае вы, впрочем, не получите свой старый пароль, поскольку онлайн-сервис на самом деле не хранит пользовательские пароли в виде обычного текста. Вместо этого он хранит их в виде хеш-значений. То есть даже сам сервис не может знать, как в действительности выглядит ваш пароль. Исключение составляют только те случаи, когда пароль очень прост и его хеш-значение широко известно в кругах взломщиков. Таким образом, если вы, воспользовавшись функцией восстановления, вдруг получили старый пароль в открытом виде, то можете быть уверены: используемый вами сервис не хеширует пользовательские пароли, что очень плохо.
Вы даже можете провести простой эксперимент: попробуйте при помощи специального сайта произвести преобразование какого-нибудь простого пароля вроде «123456» или «password» из их хеш-значений (созданных алгоритмом MD5) обратно в текст. Вероятность того, что в базе хешей найдутся данные о введенных вами простых паролях, очень высока. В моем случае хеши слов «brain» (8b373710bcf876edd91f281e50ed58ab) и «Brian» (4d236810821e8e83a025f2a83ea31820) успешно распознались, а вот хеш предыдущего абзаца — нет. Отличный пример, как раз для тех, кто все еще использует простые пароли.
Еще один пример, покруче. Не так давно по тематическим сайтам прокатилась новость о том, что популярный облачный сервис Dropbox заблокировал одного из своих пользователей за распространение контента, защищенного авторскими правами. Герой истории тут же написал об этом в твиттере, запустив волну негодования среди пользователей сервиса, ринувшихся обвинять Dropbox в том, что он якобы позволяет себе просматривать содержимое клиентских аккаунтов, хотя не имеет права этого делать.
Впрочем, необходимости в этом все равно не было. Дело в том, что владелец защищенного копирайтом контента имел на руках хеш-коды определенных аудио- и видеофайлов, запрещенных к распространению, и занес их в список блокируемых хешей. Когда пользователь предпринял попытку незаконно распространить некий контент, автоматические сканеры Dropbox засекли файлы, чьи хеши оказались в пресловутом списке, и заблокировали возможность их распространения.
Где еще можно использовать хеш-функции помимо систем хранения паролей и защиты медиафайлов? На самом деле задач, где используется хеширование, гораздо больше, чем я знаю и тем более могу описать в одной статье. Однако есть одна особенная область применения хешей, особо близкая нам как сотрудникам «Лаборатории Касперского»: хеширование широко используется для детектирования зловредных программ защитным ПО, в том числе и тем, что выпускается нашей компанией.
Как при помощи хеша ловить вирусы?
Примерно так же, как звукозаписывающие лейблы и кинопрокатные компании защищают свой контент, сообщество создает списки зловредов (многие из них доступны публично), а точнее, списки их хешей. Причем это может быть хеш не всего зловреда целиком, а лишь какого-либо его специфического и хорошо узнаваемого компонента. С одной стороны, это позволяет пользователю, обнаружившему подозрительный файл, тут же внести его хеш-код в одну из подобных открытых баз данных и проверить, не является ли файл вредоносным. С другой — то же самое может сделать и антивирусная программа, чей «движок» использует данный метод детектирования наряду с другими, более сложными.
Криптографические хеш-функции также могут использоваться для защиты от фальсификации передаваемой информации. Иными словами, вы можете удостовериться в том, что файл по пути куда-либо не претерпел никаких изменений, сравнив его хеши, снятые непосредственно до отправки и сразу после получения. Если данные были изменены даже всего на 1 байт, хеш-коды будут отличаться, как мы уже убедились в самом начале статьи. Недостаток такого подхода лишь в том, что криптографическое хеширование требует больше вычислительных мощностей или времени на вычисление, чем алгоритмы с отсутствием криптостойкости. Зато они в разы надежнее.
Кстати, в повседневной жизни мы, сами того не подозревая, иногда пользуемся простейшими хешами. Например, представьте, что вы совершаете переезд и упаковали все вещи по коробкам и ящикам. Погрузив их в грузовик, вы фиксируете количество багажных мест (то есть, по сути, количество коробок) и запоминаете это значение. По окончании выгрузки на новом месте, вместо того чтобы проверять наличие каждой коробки по списку, достаточно будет просто пересчитать их и сравнить получившееся значение с тем, что вы запомнили раньше. Если значения совпали, значит, ни одна коробка не потерялась.
Проблемы матчинга и как можно с ними бороться
Добрый день! Меня зовут Алексей Булавин, я представляю центр компетенций Сбертеха по Big Data. Представители бизнеса, владельцы продуктов и аналитики часто задают мне вопросы по одной и той же теме — матчинг. Что это такое? Зачем и как его делать? Особенно популярен вопрос «Почему он может не получиться?» В этой статье я постараюсь на них ответить.
Начнем с бытового примера. У меня есть маленький сын. Недавно он освоил мобильный телефон и теперь любит таскать его с собой, чтобы, как взрослый, непринужденно позвонить кому-нибудь когда вздумается и поговорить на какую-нибудь «очень важную» тему. Звонит он только маме, папе и бабушке. Больше всего достается бабушке: порой он по 10 раз в день звонит ей, чтобы рассказать, что с ним произошло 5 минут назад.
В детском саду у него есть друг Денис, и у Дениса тоже есть мобильный телефон. Встретившись, они как взрослые меряются телефонами, но никогда не звонят друг другу. Я как-то спросил сына:
— Почему бы тебе не позвонить и не поболтать с другом о том о сем, обсудить свои дела?
— Папа, мне это совсем не нужно, мы и так встречаемся в саду каждый день и, если что, поговорим там. Дела подождут.
Мне стало интересно, как же так? Выяснилось, что просто ни он, ни Денис не знают своего собственного номера телефона и не могут ими обменяться. Налицо отсутствие связи из-за отсутствия ключей.
Что же такое матчинг?
Новые средства взаимодействия в обществе порождают новые возможности, более тесно связывают людей, а системам указывают об их связанности. Матчинг — это один из типов связанности, который указывает на отношения субъекта с самим собой. Например, когда на разных досках объявлений продается одна и та же машина, а мы хотим связать и воспринимать эти объявления вместе, как единое целое.
Зачем нужен матчинг?
Информация сегодня представляет ценность, которую можно монетизировать. Соответственно, дополнительная информация дает дополнительную ценность, увеличение прибыли или сокращение издержек — с помощью разработки новых фич, качественного изменения существующих или вообще создания новых продуктов.
Как правило, наш продукт четко связан с теми или иными объектами, знания по которым мы хотим обогащать. Чем больше дополнительной информации из новых источников мы получаем, тем актуальней становится задача объединения информации из всех источников в единое информационное пространство, как будто это атрибуты одной системы.
Трудности матчинга
Добыть и связать данные — вроде бы стандартная техническая задача. Но из-за ряда проблем это бывает затруднительно или вовсе невозможно:
Получается, что связать объекты двух систем между собой по ключу бывает либо невозможно, либо процент и качество связанности оказываются ниже желаемого уровня. Можно попробовать собрать ключ как комбинацию нескольких информационных полей, составной ключ. Но здесь возникают новые трудности:
Кроме того, для информационных полей в составном ключе характерны трудности, которые мы упоминали ранее. Поля, входящие в составной ключ, тоже могут быть не уникальны, ошибочны, преднамеренно искажены и не постоянны.
Количество vs качество
Как же победить перечисленные выше трудности и добиться 100% матчинга? Начать стоит с вопроса: а действительно ли нужно достигать таких высоких уровней качества? Может, для решения бизнес-задачи вполне достаточно 70%?
Есть у нас составной ключ, состоящий из набора атрибутов. Каждый из них с некоторой вероятностью будет заполнен и с некоторой вероятностью подойдет для применения в качестве элемента ключа. Вероятность что весь составной ключ будет нормален — это произведение всех вероятностей по всем атрибутам ключа. Все это еще нужно умножить на вероятность того, что объект в принципе присутствует в двух системах. Тогда мы получим вероятность матчинга. А умножив ее на общее число сущностей, получим количественный прогноз по сопоставлению.
Чем меньше атрибутов в составном ключе, тем вероятность матчинга выше и при этом ближе к вероятности того, что объект есть в двух системах. Но количество сопоставлений при этом растет и чаще всего превышает прогноз. Это связано с тем, что с уменьшением числа атрибутов в составном ключе растет вероятность ошибочного сопоставления.
Проще говоря, с уменьшением количества атрибутов в составном ключе растет как число объектов сопоставленных правильно, так и число сопоставленных ошибочно. Как бы количество борется против качества. И в зависимости от бизнес-задачи можно выбрать стратегию матчинга, смещающую результат либо в сторону количества, либо в сторону качества.
Обогащение, фильтрация, нормализация
А можно ли увеличить качество и количество одновременно? Конечно можно. Для этого нужно потратить больше, а иногда и намного больше ресурсов на дополнительную обработку данных.
«Дырки» в данных можно заполнять, получая их из других полей источника. Город локации можно получить из кода телефонного номера, ИНН, кода региона. Пол можно получить из имени и фамилии или по анализу авторского текста. Алгоритмов обогащения достаточно много.
Далее данные следует пропускать через фильтры. Фильтры могут быть как стандартные, так и специфические, связанные с особенностями наполнения и трансформации данных конкретного источника. Например, к стандартным можно отнести фильтр, убирающий непечатные символы, дубли, задвоения символов, скобки, кавычки, пробелы.
К специфичным фильтрам можно отнести обнаружение и замену символов другой языковой раскладки, которые выглядят одинаково визуально в обоих языках — например, буква О в английской раскладке в имени Оля. Или обнаружение и замену символов другой языковой раскладки, которые звучат одинаково или почти одинаково в обоих языках (Света и Sвета).
К нормализации можно отнести перевод на другой язык, транслитерацию, приведение к шаблону заполнения (название, марка, телефон, адрес, пол), а также замену коротких названий на полные, замену сленга и уменьшительно-ласкательных форм.
Даже при одном составе ключа для разных источников данных зачастую следует использовать разные критерии. Это связано с тем, как конкретный источник заполняется данными. Чтобы правильно подобрать критерии, желательно собрать и проанализировать статистику по заполнению полей источника. На улучшение качества может повлиять применение коэффициента частотности по полю в источнике (например, для марки машины, фамилии), коэффициента «емкости» (например, для названия населенного пункта в зависимости от того, насколько большой этот населенный пункт по количеству жителей).
При одновременном комбинированном использовании разных ключей матчинга можно применить коэффициенты в качестве условия использования того или иного ключа. Таким же образом можно задействовать и иные критерии, например, заполненность того или иного поля. Комбинировать матчинги по разным ключам между одними и теми же источниками можно и без применения условий — результат бывает вполне приемлемый.
Другие матчинги
Есть и другие алгоритмы матчинга, которые иногда кардинально отличаются от перечисленных выше. Например, матчинг по слабому ключу в условиях связи с другим объектом, уже проматченным по сильному ключу, если емкость такой связи по определению маленькая.
Приведем пример. У любой машины или квартиры за всю ее историю, в среднем, имеется от 1 до 5 владельцев. Если в двух системах объект квартиры или машины проматчен по сильному ключу, то субъекта — владельца этой квартиры, явно с ней связанного — можно матчить по любому самому слабому параметру, например фамилии и имени.
Объекты любой социальной сети или подобной ей структуры данных с большим числом устойчивых связей можно матчить по слабым ключам, принадлежащим не самому объекту матчинга, а его окружению. Сами объекты матчинга могут иметь в дополнение собственный слабый ключ, а могут не иметь. Фактически алгоритмизируется утверждение древнегреческого поэта Еврипида: «Скажи мне, кто твои друзья, и я скажу тебе, кто ты».
Для двух источников с одной или несколькими фотографиями объектов, которые явным образом связаны с их идентификаторами в источниках, можно применить матчинг по фотографиям. На фото выделяются объекты или лица и сравниваются с такими же объектами или лицами в другом источнике. По сути, по такому принципу работают нейросетевые сервисы типа «Is your portrait in a museum?» от Google: они матчат лицо с загруженной вами фотографии с лицами средневековых людей на портретах музеев. Критерий для матчинга специально выбран мягким, чтобы получалось отдаленное, но достаточное сходство.
При наличии большого числа авторской текстовой информации в разных источниках можно попробовать алгоритмы text mining, чтобы связать авторов. Это что-то вроде анализа почерка, только анализируется не форма написания, а содержание текста.
Big data
Чтобы повышать качество матчинга, требуется применять различные алгоритмы, которые в свою очередь требуют много ресурсов. Чем больше алгоритмов, тем больше ресурсов требуется. А если данных много, они постоянно изменяются, а считать их нужно быстро и недорого?
Скорее всего, хранить, обрабатывать и матчить данные традиционными способами не получится. Стоит подумать о bigdata-инфраструктуре. Таких решений сейчас уже довольно много, от разных вендоров и на любой кошелек.
В Сбербанке, например, матчинг внутрикорпоративных данных реализован как компонент data lake на Hadoop, Spark и HBase. Это решение позволяет обрабатывать разнородные неструктурированные данные большого объема, запускать вычисления на большом кластере, где хранятся данные без накладных расходов. При этом используется опенсорсный софт и commodity-сервера, что делает решение достаточно дешевым и эффективным для такого класса задач. Про Big Data на Hadoop написано много. Мне, например, вполне нравится, как это сделано у DataArt.
Наш MatchBox
MatchBox — это система для автоматической нормализации и матчинга, которую мы используем в data lake Сбербанка. Она была недавно разработана в центре компетенций Big Data Сбертеха.
MatchBox в основном используется для построения и поддержания в актуальном состоянии единого семантического слоя данных и единого профиля клиента. Система дает возможность автоматически объединять информацию из большого числа источников в единую информационную суперсущность, встраиваться в процесс обновления информации источников. Это обогащает знания о текущих и потенциальных клиентах банка: их социально-демографических, психологических, поведенческих особенностях и потребительских предпочтениях.
MatchBox работает с данными любого качества, использует библиотеки с провалидированными алгоритмами нормализации и матчинга, имеет для этого конфигуратор пользовательских правил, работает в полностью автоматическом режиме по событию, расписанию или как сервис. MatchBox умеет масштабироваться, и количество регулярно обрабатываемых источников ограничивается только ресурсными квотами кластера.
Вот чего нам удалось добиться благодаря внедрению MatchBox:
Я надеюсь, что статья поможет ответить на вопросы, связанные с матчингом, продвинуться в понимании собственных проблем работы с данными и найти подходы к их решению.
Мэчить что это данные
Всем известно, что в деловой среде говорят на «Рунглише», что подразумевает частое использование английских слов речи. Но хорошо об этом сказал еще Грибоедов: «Смесь французского с нижегородским».
Особенно это характерно для рекламы из-за ее направленности на запад, наследия от западных рекламистов, норм в сетевых агентствах, тщеславия и простого желания казаться умнее.
Порешать косты
Составить смету. Отдельно используется «Кост Эстимейт» — примерная смета расходов, которая никогда не оказывается окончательной.
Пример: Вася, завтра с утра порешай косты, умножь на два и отправь клиенту.
Топофмайнд
От английского Top Of Mind — чуть более чем очевидный.
Челлендж
От Challenge — вызов.
Используется, когда агентство не очень понимает, как это будет работать, но ему страшно интересно.
Пример: «Давайте нарядим промогелс в космтюмы шахидок и поставим у метро. Это будет хороший челлендж».
Референс
Исходник материла в любой его форме, который можно использовать в том или ином модифицированном виде в своей рекламной идее.
Пример: Так вот откуда ты это стырил! — Нет, это был референс!
Ресёч
Процесс поиска «референсов».
Пример: Перед брейнштормингом все пары обязаны два дня заниматься ресёчем!
Давайте пошэрим наши инсайты
Эта фраза, ушедшая в народ, по уверениям инсайдеров, была придумана аккаунт-менеджером Wrigley Анной Глинкиной. Таким заклинанием она призывала креативщиков и всех проходящих мимо сесть в кружок и заняться мозговым штурмом, поделившись своими идеями и мнениями относительно собственно инсайтов.
Например: «Ледис и джентльмен, я пропозирую митинг через файв минут. Клиент напряжен олреди, давайте же уже пошэрим наши инсайты»
И еще из Ани Глинкиной: «Я не могу ходить и всех возбуждать!» (в смысле, сами должны работать, без стимуляции аккаунтом).
Очень дженерик
Свидетели свидетельствуют, что это любимая фраза Игоря Лутца, когда он высказывает свое мнение о рекламной кампании, которую можно предложить и кофейне, и производителям металлопроката, и бренду средств для унитаза.
Истоки, естественно, кроются в английском слове «generic», которое именно это и обозначает — «общий, универсальный».
Например: «Горилла, играющая на барабанах — это очень дженерик»
Мы не хэппи
Применяется к работам агентства, сотрудникам внутри, погоде, ситуации… К счастью никак не относится, обозначает сокрушение, недовольство и печаль, которые, по всей вероятности, невозможно выразить другими цензурными словами.
Например: «Мы не хэппи от этой биг айдиа»
Я тебя услышал
Удивительно, но ни одного английского слова. Грубый, дословный перевод популярного американского выражения «I heard you». В некоторых случаях заменяет «я подумаю».
Я счастлив с этим (I’m happy with that) — «Мне понравилось».
Я к вам вернусь — I will get back to you. «Я отвечу вам позже».
Это драматически увеличивает … (Dramatically Increase) — Под словом «драматически» рекламисты часто имеют ввиду «намного».
Если вы с этим ОКЕЙ, то мы тоже! — I’m okay with this.
Консерн
Выражать сомнение (concern). В зависимости от опыта рекламиста, ударение может ставиться как на первый, так и второй слог.
Например: «Инна, у всех нас есть консерн по поводу слогана «О, как освежает».
Поштормить
Так для краткости называют процесс мозгового штурма. Произносится с обреченностью и некоторым равнодушием. Недавно пришедший в агентство человек с богатой фантазией при этом слове должен представлять грандиозное шоу во время которого участники этого действия изо всех своих креативных сил изображают морской шторм, но не очень сильный и продолжительный. А вот слово «штормить» без приставки вызывает уже ассоциации со штормом более существенным.
Например: «Надо бы поштормить ради приличия»
Набрать уэйс-ин
Цель мозговых штурмов. По-русски называются «заходы» и представляют собой способы реализации идеи или даже собственно идеи, но еще ни во что неоформленные. Полученный список, просеянный групхэдом или креативным директором, представляет собой набранные уэйс-ин.
Например: «А нельзя предложить что-нибудь такое, чтобы не все набранные уэйс-ин были про „из самого сердца России“ и „от самой природы“?»
Биг Айдиа
По нелепой случайности большинство российских креативщиков считают, что у каждой сделанной ими кампании есть биг айдиа, забывая о том, что даже второклассник из немецкой школы знает, что «биг» с английского переводится «большой». Идеи в наших рекламных кампаниях чаще всего нельзя найти даже при помощи трансмиссионного электронного микроскопа с коррекцией аберрации.
Например: «Биг айдиа нашей кампании — квас о как освежает в жаркую погоду».
Чипово
То, чего нельзя допускать, когда все должно быть лахари.
Пример: Ролик за 300 тыщь это слишком чипово для нашего лахари таргета.
Искрометный копирайт
Фраза, употребляемая чаще аккаунтами на клиентских презентациях для успокоения клиента. Применяется по отношению к тексту, который вообще ничем не выделяется. Но клиент должен быть уверен в том, что это шедевр.
Например: «Наши креаторы долго и плодотворно трудились над слоганом. „Почувствуй вкус жизни“ — это самый искрометный копирайт, который был создан в нашем агентстве».
Литвишко напишет
Перевод фразы: «О музыке можно не волноваться».
Композитор Олег Литвишко за прошедшие 13 лет написал музыку едва ли не к 9 из 10 роликов из российского эфира. Умеет все, пишет для всех, удовлетворит любого клиента.
Рапижженный кадр
Это не совсем приличное словосочетание обозначает «кадр, снятый в рапиде», то есть с применением технологии замедленной съемки или Slow-motion.
Перетумачить
Слово изобрели в Leo Burnett, это своего рода перефразировка поговорки «Лучшее враг хорошего», а также обычного слова «перестараться».
Например: «Миша сказал, что вы тут сильно перетумачили с вижуалами».
Улучшайзинг
Тоже из области «перестараться», но если «перетумачить» — это уже результат, то улучшайзинг — это еще процесс, в ходе которого кажется, что становится лучше, но на самом деле становится хуже. И если успеть это понять, то можно и не перетумачить.
Например: «Вы сейчас занимаетесь улучшайзингом. Не нужно приставлять к горилле с барабанами шимпанзе с тромбоном».
Реплай
Необъяснимая логически калька с английского языка. «Ответ» он и есть «ответ». На сообщения в мессенджерах и электронной почте.
Например: «Тебе пришел реплай от Иванова?»
Нот эвэйлбл
Еще одна необъяснимая калька, переводится как «недоступен». Применяется как ответ на пример использования «реплая» или как ответ на «Ты позвонил Либерману?»
Например: «Нет, он нот эвэйлбл»
Профакапить дедлайн
Выражение произошло от двух излюбленных рекламистами слов «факап» (что-то вроде «провала») и «дедлайн» («крайний срок»). Обозначает буквально «пропустить дедлайн». В условиях российского менталитела употребляется более чем часто. После произнесения вслух паника и суета обязательны. Доводить любое дело до дедлайна — наша национальная страсть.
Например: «Какое сегодня число? Омайгад! Мы профакапили все дедлайны!!»
Пушить
Ударение на первый слог, от PUSH — ускорять и стимулировать. Обычно прелюдия перед фачить.
Вера Мошкина, СанИнБев: Мы не должны коммуницировать эскейп, нам нужно пушить консьюмера из таргет-групп на кеш велью!
Сорри, гайз
Дословный перевод выражения: «Идите в задницу, это не мои проблемы».
Тест на понимание рекламного языка:
По-моему, лишний повод для баера проспендить мани на черитэйбл, вместо того, чтобы прошерить их с адвертайзерами и вдобавок за свои мани еще и получить профакапеный дидлайн! Вот и спрашивается, факин шит или сорри гайз! :))) Нау вери попьюлар среди генеральных манагеров нью сентенс «Предложите адвертайзерам жить на проценты от прибыли, которая должна стать вери хай после их рекламных кампаний и ю’л си, что нобади агри». Вобщем черитэйблить «шеринье инсайтов» и «искрометный копирайт» рапидженых адвертайзеров уже не фэшн, т.к. мани на ветер. Многие старые компании (элдериз) по старой памяти (ностальжи) и ради приличия (джаст бекоз) всё еще тратятся на рекламные кампании, но многие новые компании (проагреджженые) уже так не считают и скорее продадут душу (селлсоул) нелепым адвайзам саентологов как продать свой факинг шит, нежели выбросят мани на ветер.