Мэчить что это данные

Мэтчинг

Мэчить что это данные. Смотреть фото Мэчить что это данные. Смотреть картинку Мэчить что это данные. Картинка про Мэчить что это данные. Фото Мэчить что это данные

Ещё один термин, пришедший к нам из английского языка. И ещё один из тех терминов, которыми так любят кидаться ультрасовременные и, как им самим, наверное, кажется, жутко модные трейдеры, брокеры, рекрутёры, игроки и много ещё кто. Дело в том, что данный термин можно отнести к множеству сфер деятельности от теории игр до найма персонала, а потому и услышать его можно где угодно и от кого угодно.

На самом деле, в этом слове нет ничего заумного. Банальный перевод с английского языка в Google Translate говорит нам о том, что мэтчинг (от англ. matching) по-русски означает не что иное, как согласование. То есть, когда речь идёт о стыке каких либо объектов или величин в плане их соответствия друг с другом (покупки и продажи, подрядчика и заказчика и даже мужчины и женщины), можно смело использовать слово мэтчинг.

Мэчить что это данные. Смотреть фото Мэчить что это данные. Смотреть картинку Мэчить что это данные. Картинка про Мэчить что это данные. Фото Мэчить что это данные

В экономике, словом мэтчинг принято описывать поведение экономических агентов, в результате которого получается одновременный взаимный выбор ими друг друга. Это поведение можно описать, так называемой задачей о марьяже, за решение которой, между прочим, была присвоена Нобелевская премия по экономике за 2012 год.

Решение этой задачи было предложено математиками Дэвидом Гейлом и Ллойдом Шепли и в настоящее время широко используется в таких видах деятельности как набор клиниками врачей и интернов, набор спортсменов в команды, набор сотрудников и т.п.

Ну а что касается нашей тематики, а вы сейчас находитесь на страницах интернет-журнала для трейдеров и инвесторов, то термин мэтчинг применяется здесь в двух основных значениях:

Кроме этого, есть такое понятие как электронный мэтчинг. С его помощью, в частности, упрощаются расчёты по ценным бумагам внутри депозитария. Для клиентов депозитария использование электронного мэтчинга даёт следующие основные преимущества:

Источник

Архив: Смэтчить данные (найти наиболее похожие друг на друга данные)

1500 анализов. Данные, которые доступны про каждый анализ: название + биоматериал. Что такое одинаковые анализы?Необходимое условие:Биоматериалы анализов совпадают, т.е., например, анализы являются одинаковыми, если их биоматериалом является сыворотка крови или кровь с ЭДТА. Примечание 1: есть одна лаборатория (CMD), у которой не прописано, что это точно за биоматериал, а прописано только общими словами, например, кровь (в случае с этой лабораторией достаточно совпадения биоматериала с точностью до смысла, т.е. ”кровь” = ”кровь с ЭДТА” или ”кровь” = ”кровь с натрием”)Примечание 2: биоматериалы у разных лабораторий могут называться по-разному, например, ”кровь с ЭДТА” или ”кровь (ЭДТА)”, но у одной лаборатории названия одинаковых биоматериалов идентичны (я понимаю, что очень легко было привести к единому виду в excel, но у меня как назло полетел офис)Достаточное условие:а) анализы, называющиеся одинаковоб) анализы, называющиеся немного по-разному, но обозначающие одно и то же Примеры одинаковых анализов:1) Антитела к кардиолипину (Anticardiolipin antibodies) класса IgM, сыворотка крови
2) Антитела к кардиолипину IgM (Антикардиолипиновые антитела IgM, АКЛ IgM, Cardiolipin Antibodies IgM, aCL antibody IgM, APAs IgM), кровь3) Антитела к кардиолипину, IgM, сыворотка крови1) Исследование соскобов с шейки матки и цервикального канала, мазок2) Исследование соскобов шейки матки и цервикального канала (Examination of Scrapings: Cervix and Cervical Canal ), мазок из влагалища1) Кобальт (моча), моча2) Кобальт в моче (Cobalt), мочаКак предполагается искать одинаковые анализы?Поиск конкретных методы метчинга всегда ваш выбор, но мне кажется, что наиболее эффективно делать следующим образом: искать по словам и/или символам те, которые максимально друг с другом совпадают, а далее руками проверять, действительно ли они одинаковыеВ каком формате хочется увидеть результат?https://docs.google.com/spreadsheets/d/1I9qBzMNoUzLd5WXuo6J1LA70mDEKVVlCaYbkzjfmjQw/edit?usp=sharingЧто является критерием достижения результата?1) Я бы хотела, чтобы

70% анализов каждой лаборатории было найдено соответствие хотя бы в двух лабораториях. При этом, этот процент может меняться от лаборатории к лаборатории. Например, у одной лабы

500 видов анализов, поэтому совершенно точно для 90% можно найти соответствующий хотя бы в одной лаборатории.У другой лаборатории

Источник

Чудеса хеширования

Криптографические хеш-функции — незаменимый и повсеместно распространенный инструмент, используемый для выполнения целого ряда задач, включая аутентификацию, защиту файлов и даже обнаружение зловредного ПО. Как они работают и где применяются?

Мэчить что это данные. Смотреть фото Мэчить что это данные. Смотреть картинку Мэчить что это данные. Картинка про Мэчить что это данные. Фото Мэчить что это данные

Мэчить что это данные. Смотреть фото Мэчить что это данные. Смотреть картинку Мэчить что это данные. Картинка про Мэчить что это данные. Фото Мэчить что это данные

Криптографические хеш-функции — незаменимый и повсеместно распространенный инструмент, используемый для выполнения целого ряда задач, включая аутентификацию, проверку целостности данных, защиту файлов и даже обнаружение зловредного ПО. Существует масса алгоритмов хеширования, отличающихся криптостойкостью, сложностью, разрядностью и другими свойствами. Считается, что идея хеширования принадлежит сотруднику IBM, появилась около 50 лет назад и с тех пор не претерпела принципиальных изменений. Зато в наши дни хеширование обрело массу новых свойств и используется в очень многих областях информационных технологий.

Что такое хеш?

Если коротко, то криптографическая хеш-функция, чаще называемая просто хешем, — это математический алгоритм, преобразовывающий произвольный массив данных в состоящую из букв и цифр строку фиксированной длины. Причем при условии использования того же типа хеша длина эта будет оставаться неизменной, вне зависимости от объема вводных данных. Криптостойкой хеш-функция может быть только в том случае, если выполняются главные требования: стойкость к восстановлению хешируемых данных и стойкость к коллизиям, то есть образованию из двух разных массивов данных двух одинаковых значений хеша. Интересно, что под данные требования формально не подпадает ни один из существующих алгоритмов, поскольку нахождение обратного хешу значения — вопрос лишь вычислительных мощностей. По факту же в случае с некоторыми особо продвинутыми алгоритмами этот процесс может занимать чудовищно много времени.

Как работает хеш?

Например, мое имя — Brian — после преобразования хеш-функцией SHA-1 (одной из самых распространенных наряду с MD5 и SHA-2) при помощи онлайн-генератора будет выглядеть так: 75c450c3f963befb912ee79f0b63e563652780f0. Как вам скажет, наверное, любой другой Брайан, данное имя нередко пишут с ошибкой, что в итоге превращает его в слово brain (мозг). Это настолько частая опечатка, что однажды я даже получил настоящие водительские права, на которых вместо моего имени красовалось Brain Donohue. Впрочем, это уже другая история. Так вот, если снова воспользоваться алгоритмом SHA-1, то слово Brain трансформируется в строку 97fb724268c2de1e6432d3816239463a6aaf8450. Как видите, результаты значительно отличаются друг от друга, даже несмотря на то, что разница между моим именем и названием органа центральной нервной системы заключается лишь в последовательности написания двух гласных. Более того, если я преобразую тем же алгоритмом собственное имя, но написанное уже со строчной буквы, то результат все равно не будет иметь ничего общего с двумя предыдущими: 760e7dab2836853c63805033e514668301fa9c47.

Впрочем, кое-что общее у них все же есть: каждая строка имеет длину ровно 40 символов. Казалось бы, ничего удивительного, ведь все введенные мною слова также имели одинаковую длину — 5 букв. Однако если вы захешируете весь предыдущий абзац целиком, то все равно получите последовательность, состоящую ровно из 40 символов: c5e7346089419bb4ab47aaa61ef3755d122826e2. То есть 1128 символов, включая пробелы, были ужаты до строки той же длины, что и пятибуквенное слово. То же самое произойдет даже с полным собранием сочинений Уильяма Шекспира: на выходе вы получите строку из 40 букв и цифр. При всем этом не может существовать двух разных массивов данных, которые преобразовывались бы в одинаковый хеш.

Вот как это выглядит, если изобразить все вышесказанное в виде схемы:

Мэчить что это данные. Смотреть фото Мэчить что это данные. Смотреть картинку Мэчить что это данные. Картинка про Мэчить что это данные. Фото Мэчить что это данные

Для чего используется хеш?

Отличный вопрос. Однако ответ не так прост, поскольку криптохеши используются для огромного количества вещей.

Для нас с вами, простых пользователей, наиболее распространенная область применения хеширования — хранение паролей. К примеру, если вы забыли пароль к какому-либо онлайн-сервису, скорее всего, придется воспользоваться функцией восстановления пароля. В этом случае вы, впрочем, не получите свой старый пароль, поскольку онлайн-сервис на самом деле не хранит пользовательские пароли в виде обычного текста. Вместо этого он хранит их в виде хеш-значений. То есть даже сам сервис не может знать, как в действительности выглядит ваш пароль. Исключение составляют только те случаи, когда пароль очень прост и его хеш-значение широко известно в кругах взломщиков. Таким образом, если вы, воспользовавшись функцией восстановления, вдруг получили старый пароль в открытом виде, то можете быть уверены: используемый вами сервис не хеширует пользовательские пароли, что очень плохо.

Вы даже можете провести простой эксперимент: попробуйте при помощи специального сайта произвести преобразование какого-нибудь простого пароля вроде «123456» или «password» из их хеш-значений (созданных алгоритмом MD5) обратно в текст. Вероятность того, что в базе хешей найдутся данные о введенных вами простых паролях, очень высока. В моем случае хеши слов «brain» (8b373710bcf876edd91f281e50ed58ab) и «Brian» (4d236810821e8e83a025f2a83ea31820) успешно распознались, а вот хеш предыдущего абзаца — нет. Отличный пример, как раз для тех, кто все еще использует простые пароли.

Еще один пример, покруче. Не так давно по тематическим сайтам прокатилась новость о том, что популярный облачный сервис Dropbox заблокировал одного из своих пользователей за распространение контента, защищенного авторскими правами. Герой истории тут же написал об этом в твиттере, запустив волну негодования среди пользователей сервиса, ринувшихся обвинять Dropbox в том, что он якобы позволяет себе просматривать содержимое клиентских аккаунтов, хотя не имеет права этого делать.

Впрочем, необходимости в этом все равно не было. Дело в том, что владелец защищенного копирайтом контента имел на руках хеш-коды определенных аудио- и видеофайлов, запрещенных к распространению, и занес их в список блокируемых хешей. Когда пользователь предпринял попытку незаконно распространить некий контент, автоматические сканеры Dropbox засекли файлы, чьи хеши оказались в пресловутом списке, и заблокировали возможность их распространения.

Где еще можно использовать хеш-функции помимо систем хранения паролей и защиты медиафайлов? На самом деле задач, где используется хеширование, гораздо больше, чем я знаю и тем более могу описать в одной статье. Однако есть одна особенная область применения хешей, особо близкая нам как сотрудникам «Лаборатории Касперского»: хеширование широко используется для детектирования зловредных программ защитным ПО, в том числе и тем, что выпускается нашей компанией.

Как при помощи хеша ловить вирусы?

Примерно так же, как звукозаписывающие лейблы и кинопрокатные компании защищают свой контент, сообщество создает списки зловредов (многие из них доступны публично), а точнее, списки их хешей. Причем это может быть хеш не всего зловреда целиком, а лишь какого-либо его специфического и хорошо узнаваемого компонента. С одной стороны, это позволяет пользователю, обнаружившему подозрительный файл, тут же внести его хеш-код в одну из подобных открытых баз данных и проверить, не является ли файл вредоносным. С другой — то же самое может сделать и антивирусная программа, чей «движок» использует данный метод детектирования наряду с другими, более сложными.

Криптографические хеш-функции также могут использоваться для защиты от фальсификации передаваемой информации. Иными словами, вы можете удостовериться в том, что файл по пути куда-либо не претерпел никаких изменений, сравнив его хеши, снятые непосредственно до отправки и сразу после получения. Если данные были изменены даже всего на 1 байт, хеш-коды будут отличаться, как мы уже убедились в самом начале статьи. Недостаток такого подхода лишь в том, что криптографическое хеширование требует больше вычислительных мощностей или времени на вычисление, чем алгоритмы с отсутствием криптостойкости. Зато они в разы надежнее.

Кстати, в повседневной жизни мы, сами того не подозревая, иногда пользуемся простейшими хешами. Например, представьте, что вы совершаете переезд и упаковали все вещи по коробкам и ящикам. Погрузив их в грузовик, вы фиксируете количество багажных мест (то есть, по сути, количество коробок) и запоминаете это значение. По окончании выгрузки на новом месте, вместо того чтобы проверять наличие каждой коробки по списку, достаточно будет просто пересчитать их и сравнить получившееся значение с тем, что вы запомнили раньше. Если значения совпали, значит, ни одна коробка не потерялась.

Источник

Проблемы матчинга и как можно с ними бороться

Добрый день! Меня зовут Алексей Булавин, я представляю центр компетенций Сбертеха по Big Data. Представители бизнеса, владельцы продуктов и аналитики часто задают мне вопросы по одной и той же теме — матчинг. Что это такое? Зачем и как его делать? Особенно популярен вопрос «Почему он может не получиться?» В этой статье я постараюсь на них ответить.

Мэчить что это данные. Смотреть фото Мэчить что это данные. Смотреть картинку Мэчить что это данные. Картинка про Мэчить что это данные. Фото Мэчить что это данные

Начнем с бытового примера. У меня есть маленький сын. Недавно он освоил мобильный телефон и теперь любит таскать его с собой, чтобы, как взрослый, непринужденно позвонить кому-нибудь когда вздумается и поговорить на какую-нибудь «очень важную» тему. Звонит он только маме, папе и бабушке. Больше всего достается бабушке: порой он по 10 раз в день звонит ей, чтобы рассказать, что с ним произошло 5 минут назад.

В детском саду у него есть друг Денис, и у Дениса тоже есть мобильный телефон. Встретившись, они как взрослые меряются телефонами, но никогда не звонят друг другу. Я как-то спросил сына:

— Почему бы тебе не позвонить и не поболтать с другом о том о сем, обсудить свои дела?
— Папа, мне это совсем не нужно, мы и так встречаемся в саду каждый день и, если что, поговорим там. Дела подождут.

Мне стало интересно, как же так? Выяснилось, что просто ни он, ни Денис не знают своего собственного номера телефона и не могут ими обменяться. Налицо отсутствие связи из-за отсутствия ключей.

Что же такое матчинг?

Новые средства взаимодействия в обществе порождают новые возможности, более тесно связывают людей, а системам указывают об их связанности. Матчинг — это один из типов связанности, который указывает на отношения субъекта с самим собой. Например, когда на разных досках объявлений продается одна и та же машина, а мы хотим связать и воспринимать эти объявления вместе, как единое целое.

Зачем нужен матчинг?

Информация сегодня представляет ценность, которую можно монетизировать. Соответственно, дополнительная информация дает дополнительную ценность, увеличение прибыли или сокращение издержек — с помощью разработки новых фич, качественного изменения существующих или вообще создания новых продуктов.

Как правило, наш продукт четко связан с теми или иными объектами, знания по которым мы хотим обогащать. Чем больше дополнительной информации из новых источников мы получаем, тем актуальней становится задача объединения информации из всех источников в единое информационное пространство, как будто это атрибуты одной системы.

Трудности матчинга

Добыть и связать данные — вроде бы стандартная техническая задача. Но из-за ряда проблем это бывает затруднительно или вовсе невозможно:

Мэчить что это данные. Смотреть фото Мэчить что это данные. Смотреть картинку Мэчить что это данные. Картинка про Мэчить что это данные. Фото Мэчить что это данные

Получается, что связать объекты двух систем между собой по ключу бывает либо невозможно, либо процент и качество связанности оказываются ниже желаемого уровня. Можно попробовать собрать ключ как комбинацию нескольких информационных полей, составной ключ. Но здесь возникают новые трудности:

Кроме того, для информационных полей в составном ключе характерны трудности, которые мы упоминали ранее. Поля, входящие в составной ключ, тоже могут быть не уникальны, ошибочны, преднамеренно искажены и не постоянны.

Количество vs качество

Как же победить перечисленные выше трудности и добиться 100% матчинга? Начать стоит с вопроса: а действительно ли нужно достигать таких высоких уровней качества? Может, для решения бизнес-задачи вполне достаточно 70%?

Есть у нас составной ключ, состоящий из набора атрибутов. Каждый из них с некоторой вероятностью будет заполнен и с некоторой вероятностью подойдет для применения в качестве элемента ключа. Вероятность что весь составной ключ будет нормален — это произведение всех вероятностей по всем атрибутам ключа. Все это еще нужно умножить на вероятность того, что объект в принципе присутствует в двух системах. Тогда мы получим вероятность матчинга. А умножив ее на общее число сущностей, получим количественный прогноз по сопоставлению.
Чем меньше атрибутов в составном ключе, тем вероятность матчинга выше и при этом ближе к вероятности того, что объект есть в двух системах. Но количество сопоставлений при этом растет и чаще всего превышает прогноз. Это связано с тем, что с уменьшением числа атрибутов в составном ключе растет вероятность ошибочного сопоставления.

Проще говоря, с уменьшением количества атрибутов в составном ключе растет как число объектов сопоставленных правильно, так и число сопоставленных ошибочно. Как бы количество борется против качества. И в зависимости от бизнес-задачи можно выбрать стратегию матчинга, смещающую результат либо в сторону количества, либо в сторону качества.

Обогащение, фильтрация, нормализация

А можно ли увеличить качество и количество одновременно? Конечно можно. Для этого нужно потратить больше, а иногда и намного больше ресурсов на дополнительную обработку данных.
«Дырки» в данных можно заполнять, получая их из других полей источника. Город локации можно получить из кода телефонного номера, ИНН, кода региона. Пол можно получить из имени и фамилии или по анализу авторского текста. Алгоритмов обогащения достаточно много.

Далее данные следует пропускать через фильтры. Фильтры могут быть как стандартные, так и специфические, связанные с особенностями наполнения и трансформации данных конкретного источника. Например, к стандартным можно отнести фильтр, убирающий непечатные символы, дубли, задвоения символов, скобки, кавычки, пробелы.

К специфичным фильтрам можно отнести обнаружение и замену символов другой языковой раскладки, которые выглядят одинаково визуально в обоих языках — например, буква О в английской раскладке в имени Оля. Или обнаружение и замену символов другой языковой раскладки, которые звучат одинаково или почти одинаково в обоих языках (Света и Sвета).

К нормализации можно отнести перевод на другой язык, транслитерацию, приведение к шаблону заполнения (название, марка, телефон, адрес, пол), а также замену коротких названий на полные, замену сленга и уменьшительно-ласкательных форм.

Даже при одном составе ключа для разных источников данных зачастую следует использовать разные критерии. Это связано с тем, как конкретный источник заполняется данными. Чтобы правильно подобрать критерии, желательно собрать и проанализировать статистику по заполнению полей источника. На улучшение качества может повлиять применение коэффициента частотности по полю в источнике (например, для марки машины, фамилии), коэффициента «емкости» (например, для названия населенного пункта в зависимости от того, насколько большой этот населенный пункт по количеству жителей).

При одновременном комбинированном использовании разных ключей матчинга можно применить коэффициенты в качестве условия использования того или иного ключа. Таким же образом можно задействовать и иные критерии, например, заполненность того или иного поля. Комбинировать матчинги по разным ключам между одними и теми же источниками можно и без применения условий — результат бывает вполне приемлемый.

Другие матчинги

Есть и другие алгоритмы матчинга, которые иногда кардинально отличаются от перечисленных выше. Например, матчинг по слабому ключу в условиях связи с другим объектом, уже проматченным по сильному ключу, если емкость такой связи по определению маленькая.

Приведем пример. У любой машины или квартиры за всю ее историю, в среднем, имеется от 1 до 5 владельцев. Если в двух системах объект квартиры или машины проматчен по сильному ключу, то субъекта — владельца этой квартиры, явно с ней связанного — можно матчить по любому самому слабому параметру, например фамилии и имени.

Объекты любой социальной сети или подобной ей структуры данных с большим числом устойчивых связей можно матчить по слабым ключам, принадлежащим не самому объекту матчинга, а его окружению. Сами объекты матчинга могут иметь в дополнение собственный слабый ключ, а могут не иметь. Фактически алгоритмизируется утверждение древнегреческого поэта Еврипида: «Скажи мне, кто твои друзья, и я скажу тебе, кто ты».

Для двух источников с одной или несколькими фотографиями объектов, которые явным образом связаны с их идентификаторами в источниках, можно применить матчинг по фотографиям. На фото выделяются объекты или лица и сравниваются с такими же объектами или лицами в другом источнике. По сути, по такому принципу работают нейросетевые сервисы типа «Is your portrait in a museum?» от Google: они матчат лицо с загруженной вами фотографии с лицами средневековых людей на портретах музеев. Критерий для матчинга специально выбран мягким, чтобы получалось отдаленное, но достаточное сходство.

Мэчить что это данные. Смотреть фото Мэчить что это данные. Смотреть картинку Мэчить что это данные. Картинка про Мэчить что это данные. Фото Мэчить что это данные

При наличии большого числа авторской текстовой информации в разных источниках можно попробовать алгоритмы text mining, чтобы связать авторов. Это что-то вроде анализа почерка, только анализируется не форма написания, а содержание текста.

Big data

Чтобы повышать качество матчинга, требуется применять различные алгоритмы, которые в свою очередь требуют много ресурсов. Чем больше алгоритмов, тем больше ресурсов требуется. А если данных много, они постоянно изменяются, а считать их нужно быстро и недорого?

Скорее всего, хранить, обрабатывать и матчить данные традиционными способами не получится. Стоит подумать о bigdata-инфраструктуре. Таких решений сейчас уже довольно много, от разных вендоров и на любой кошелек.

В Сбербанке, например, матчинг внутрикорпоративных данных реализован как компонент data lake на Hadoop, Spark и HBase. Это решение позволяет обрабатывать разнородные неструктурированные данные большого объема, запускать вычисления на большом кластере, где хранятся данные без накладных расходов. При этом используется опенсорсный софт и commodity-сервера, что делает решение достаточно дешевым и эффективным для такого класса задач. Про Big Data на Hadoop написано много. Мне, например, вполне нравится, как это сделано у DataArt.

Наш MatchBox

MatchBox — это система для автоматической нормализации и матчинга, которую мы используем в data lake Сбербанка. Она была недавно разработана в центре компетенций Big Data Сбертеха.
MatchBox в основном используется для построения и поддержания в актуальном состоянии единого семантического слоя данных и единого профиля клиента. Система дает возможность автоматически объединять информацию из большого числа источников в единую информационную суперсущность, встраиваться в процесс обновления информации источников. Это обогащает знания о текущих и потенциальных клиентах банка: их социально-демографических, психологических, поведенческих особенностях и потребительских предпочтениях.

MatchBox работает с данными любого качества, использует библиотеки с провалидированными алгоритмами нормализации и матчинга, имеет для этого конфигуратор пользовательских правил, работает в полностью автоматическом режиме по событию, расписанию или как сервис. MatchBox умеет масштабироваться, и количество регулярно обрабатываемых источников ограничивается только ресурсными квотами кластера.

Вот чего нам удалось добиться благодаря внедрению MatchBox:

Я надеюсь, что статья поможет ответить на вопросы, связанные с матчингом, продвинуться в понимании собственных проблем работы с данными и найти подходы к их решению.

Источник

Мэчить что это данные

Всем известно, что в деловой среде говорят на «Рунглише», что подразумевает частое использование английских слов речи. Но хорошо об этом сказал еще Грибоедов: «Смесь французского с нижегородским».

Особенно это характерно для рекламы из-за ее направленности на запад, наследия от западных рекламистов, норм в сетевых агентствах, тщеславия и простого желания казаться умнее.

Порешать косты
Составить смету. Отдельно используется «Кост Эстимейт» — примерная смета расходов, которая никогда не оказывается окончательной.

Пример: Вася, завтра с утра порешай косты, умножь на два и отправь клиенту.

Топофмайнд
От английского Top Of Mind — чуть более чем очевидный.

Челлендж
От Challenge — вызов.

Используется, когда агентство не очень понимает, как это будет работать, но ему страшно интересно.

Пример: «Давайте нарядим промогелс в космтюмы шахидок и поставим у метро. Это будет хороший челлендж».

Референс
Исходник материла в любой его форме, который можно использовать в том или ином модифицированном виде в своей рекламной идее.

Пример: Так вот откуда ты это стырил! — Нет, это был референс!

Ресёч
Процесс поиска «референсов».

Пример: Перед брейнштормингом все пары обязаны два дня заниматься ресёчем!

Давайте пошэрим наши инсайты
Эта фраза, ушедшая в народ, по уверениям инсайдеров, была придумана аккаунт-менеджером Wrigley Анной Глинкиной. Таким заклинанием она призывала креативщиков и всех проходящих мимо сесть в кружок и заняться мозговым штурмом, поделившись своими идеями и мнениями относительно собственно инсайтов.

Например: «Ледис и джентльмен, я пропозирую митинг через файв минут. Клиент напряжен олреди, давайте же уже пошэрим наши инсайты»

И еще из Ани Глинкиной: «Я не могу ходить и всех возбуждать!» (в смысле, сами должны работать, без стимуляции аккаунтом).

Очень дженерик
Свидетели свидетельствуют, что это любимая фраза Игоря Лутца, когда он высказывает свое мнение о рекламной кампании, которую можно предложить и кофейне, и производителям металлопроката, и бренду средств для унитаза.

Истоки, естественно, кроются в английском слове «generic», которое именно это и обозначает — «общий, универсальный».
Например: «Горилла, играющая на барабанах — это очень дженерик»

Мы не хэппи
Применяется к работам агентства, сотрудникам внутри, погоде, ситуации… К счастью никак не относится, обозначает сокрушение, недовольство и печаль, которые, по всей вероятности, невозможно выразить другими цензурными словами.

Например: «Мы не хэппи от этой биг айдиа»

Я тебя услышал
Удивительно, но ни одного английского слова. Грубый, дословный перевод популярного американского выражения «I heard you». В некоторых случаях заменяет «я подумаю».

Я счастлив с этим (I’m happy with that) — «Мне понравилось».

Я к вам вернусь — I will get back to you. «Я отвечу вам позже».

Это драматически увеличивает … (Dramatically Increase) — Под словом «драматически» рекламисты часто имеют ввиду «намного».

Если вы с этим ОКЕЙ, то мы тоже! — I’m okay with this.

Консерн
Выражать сомнение (concern). В зависимости от опыта рекламиста, ударение может ставиться как на первый, так и второй слог.

Например: «Инна, у всех нас есть консерн по поводу слогана «О, как освежает».

Поштормить
Так для краткости называют процесс мозгового штурма. Произносится с обреченностью и некоторым равнодушием. Недавно пришедший в агентство человек с богатой фантазией при этом слове должен представлять грандиозное шоу во время которого участники этого действия изо всех своих креативных сил изображают морской шторм, но не очень сильный и продолжительный. А вот слово «штормить» без приставки вызывает уже ассоциации со штормом более существенным.

Например: «Надо бы поштормить ради приличия»

Набрать уэйс-ин
Цель мозговых штурмов. По-русски называются «заходы» и представляют собой способы реализации идеи или даже собственно идеи, но еще ни во что неоформленные. Полученный список, просеянный групхэдом или креативным директором, представляет собой набранные уэйс-ин.

Например: «А нельзя предложить что-нибудь такое, чтобы не все набранные уэйс-ин были про „из самого сердца России“ и „от самой природы“?»

Биг Айдиа
По нелепой случайности большинство российских креативщиков считают, что у каждой сделанной ими кампании есть биг айдиа, забывая о том, что даже второклассник из немецкой школы знает, что «биг» с английского переводится «большой». Идеи в наших рекламных кампаниях чаще всего нельзя найти даже при помощи трансмиссионного электронного микроскопа с коррекцией аберрации.

Например: «Биг айдиа нашей кампании — квас о как освежает в жаркую погоду».

Чипово
То, чего нельзя допускать, когда все должно быть лахари.

Пример: Ролик за 300 тыщь это слишком чипово для нашего лахари таргета.

Искрометный копирайт
Фраза, употребляемая чаще аккаунтами на клиентских презентациях для успокоения клиента. Применяется по отношению к тексту, который вообще ничем не выделяется. Но клиент должен быть уверен в том, что это шедевр.

Например: «Наши креаторы долго и плодотворно трудились над слоганом. „Почувствуй вкус жизни“ — это самый искрометный копирайт, который был создан в нашем агентстве».

Литвишко напишет
Перевод фразы: «О музыке можно не волноваться».

Композитор Олег Литвишко за прошедшие 13 лет написал музыку едва ли не к 9 из 10 роликов из российского эфира. Умеет все, пишет для всех, удовлетворит любого клиента.

Рапижженный кадр
Это не совсем приличное словосочетание обозначает «кадр, снятый в рапиде», то есть с применением технологии замедленной съемки или Slow-motion.

Перетумачить
Слово изобрели в Leo Burnett, это своего рода перефразировка поговорки «Лучшее враг хорошего», а также обычного слова «перестараться».

Например: «Миша сказал, что вы тут сильно перетумачили с вижуалами».

Улучшайзинг
Тоже из области «перестараться», но если «перетумачить» — это уже результат, то улучшайзинг — это еще процесс, в ходе которого кажется, что становится лучше, но на самом деле становится хуже. И если успеть это понять, то можно и не перетумачить.

Например: «Вы сейчас занимаетесь улучшайзингом. Не нужно приставлять к горилле с барабанами шимпанзе с тромбоном».

Реплай
Необъяснимая логически калька с английского языка. «Ответ» он и есть «ответ». На сообщения в мессенджерах и электронной почте.

Например: «Тебе пришел реплай от Иванова?»

Нот эвэйлбл
Еще одна необъяснимая калька, переводится как «недоступен». Применяется как ответ на пример использования «реплая» или как ответ на «Ты позвонил Либерману?»

Например: «Нет, он нот эвэйлбл»

Профакапить дедлайн
Выражение произошло от двух излюбленных рекламистами слов «факап» (что-то вроде «провала») и «дедлайн» («крайний срок»). Обозначает буквально «пропустить дедлайн». В условиях российского менталитела употребляется более чем часто. После произнесения вслух паника и суета обязательны. Доводить любое дело до дедлайна — наша национальная страсть.

Например: «Какое сегодня число? Омайгад! Мы профакапили все дедлайны!!»

Пушить
Ударение на первый слог, от PUSH — ускорять и стимулировать. Обычно прелюдия перед фачить.

Вера Мошкина, СанИнБев: Мы не должны коммуницировать эскейп, нам нужно пушить консьюмера из таргет-групп на кеш велью!

Сорри, гайз
Дословный перевод выражения: «Идите в задницу, это не мои проблемы».

Тест на понимание рекламного языка:
По-моему, лишний повод для баера проспендить мани на черитэйбл, вместо того, чтобы прошерить их с адвертайзерами и вдобавок за свои мани еще и получить профакапеный дидлайн! Вот и спрашивается, факин шит или сорри гайз! :))) Нау вери попьюлар среди генеральных манагеров нью сентенс «Предложите адвертайзерам жить на проценты от прибыли, которая должна стать вери хай после их рекламных кампаний и ю’л си, что нобади агри». Вобщем черитэйблить «шеринье инсайтов» и «искрометный копирайт» рапидженых адвертайзеров уже не фэшн, т.к. мани на ветер. Многие старые компании (элдериз) по старой памяти (ностальжи) и ради приличия (джаст бекоз) всё еще тратятся на рекламные кампании, но многие новые компании (проагреджженые) уже так не считают и скорее продадут душу (селлсоул) нелепым адвайзам саентологов как продать свой факинг шит, нежели выбросят мани на ветер.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *