Переписка под колпаком: как хранить сообщения и интервью и не нарушить закон

Представьте, сколько личной информации мы ежедневно доверяем письмам, чатам и интервью. В каждом письме или сообщении могут мелькнуть имя, адрес, номер телефона или даже паспортные данные – всё это персональные данные. Запись голосового интервью и вовсе несёт биометрическую информацию – голос, по которому можно узнать человека.

Неудивительно, что хранение таких материалов превратилось в минное поле для бизнеса: с одной стороны, эти данные ценны (для аналитики, обучения ИИ, улучшения сервисов и т.д.), с другой – Конституция прямо запрещает собирать и хранить сведения о частной жизни без согласия человека (источник consultant.ru). Где же грань между полезным хранением и нарушением закона? И как обезличивание (анонимизация) данных помогает пройти по этому тонкому льду?

Сформированное изображение

Тайна переписки vs. бизнес-реальность

Тайна переписки – не пустой звук. В российской Конституции сказано чётко: нельзя собирать и хранить информацию о частной жизни человека без его согласия. Личная переписка, будь то электронные письма или сообщения в мессенджере, однозначно относится к приватной сфере.

Тем не менее в бизнес-практике возникают ситуации, когда переписку приходится хранить. Например, служба поддержки сохраняет историю чатов с клиентами, менеджеры – переписку с партнёрами, а HR-специалисты – переписку с соискателями. Это необходимость для работы, но закон требует соблюдать ряд условий.

Во-первых, должна быть законная база для хранения. Чаще всего – согласие самого пользователя или работника. Любая обработка персональных данных законна либо с согласия субъекта, либо в случаях, предусмотренных законом (источник mmdc.ru). Например, когда вы оставляете отзыв или заполняете форму на сайте, вы ставите «галочку» – даёте согласие на обработку своих данных.

В корпоративной почте ситуация сложнее: работодатель может хранить рабочую переписку без отдельного согласия, если это необходимо для исполнения трудового договора или законных интересов компании. Но границы тут тонкие. Если в рабочей переписке затрагивается частная жизнь сотрудника, риски нарушить право на приватность возрастают.

Во-вторых, объём и срок хранения данных должны соответствовать цели. Закон обязывает хранить персональные данные не дольше, чем нужно для целей обработки (источник unisender.com). Скажем, если компания записывает звонок клиента для улучшения качества сервиса, она не имеет права держать эту запись вечно «про запас». Как только цель достигнута – запись либо удаляется, либо обезличивается. Это ключевой принцип: не превращать архив переписок в кладбище вечных личных сведений.

Наконец, хранить данные нужно безопасно. Это не просто совет, а обязанность оператора данных: защитить архив переписок от утечек и постороннего доступа. Вспомним, что в 2022 году в России произошли утечки более 660 млн записей с персональными данными. Штрафы за такие инциденты уже сейчас достигают миллионов рублей, а будут только расти.

Недаром в Госдуму внесены поправки с штрафами до 500 млн руб. за утечки данных (источник rbc.ru). Добавим к этому перспективу оборотных штрафов (процент от годовой выручки) – и вопросы хранения переписок перестают казаться рутиной. Цена ошибки слишком высока.

Интервью под запись: с чем согласен ваш собеседник?

Отдельный разговор – запись интервью. Казалось бы, обычная практика: HR записывает интервью с кандидатом на вакансию, журналист – беседу с экспертом, UX-исследователь – разговор с пользователем. Но тут мы вступаем на территорию не только персональных, но и биометрических данных. Российский закон относит к биометрии изображение лица (фото, видео) и запись голоса, если по ним можно идентифицировать человека (источник consultant.ru).

Обрабатывать такие данные можно только с письменного согласия субъекта. То есть, приглашая кандидата на Zoom-интервью с записью, HR по закону должен заранее получить от него отдельное письменное согласие на обработку биометрических персональных данных (голоса, изображения). Простого устного «OK, можете записывать» – недостаточно.

Конечно, есть исключения. Если обработка необходимых персональных данных прямо предусмотрена законом, отдельное согласие не требуется. Например, проверка паспорта при приёме на работу установлена трудовым законодательством. Но запись разговоров к таким исключениям обычно не относится. Более того, видео- и аудиозаписи защищены ещё и нормами о тайне переговоров.

В разных странах требования различаются: где-то достаточно согласия одной стороны беседы, а где-то – всех участников (источник barraiser.com). В Европе действует строгий GDPR: компании обязаны подробно объяснить, зачем ведётся запись, как она хранится, когда будет уничтожена, и получить от человека информированное согласие. В итоге грамотный HR перед началом записи интервью всегда предупредит кандидата, даст подписать нужные документы и разъяснит, зачем это нужно. Кстати, это ещё и вопрос доверия к работодателю: прозрачность в обращении с данными сейчас часть репутации.

Отдельно стоит упомянуть психологический момент. Запись интервью – стрессовый фактор. Исследования показывают, что когда человека записывают на камеру или диктофон, у него повышается уровень тревожности.

Кандидат может скованно себя чувствовать, зная, что каждое слово останется в архиве. Поэтому многие компании стараются смягчить эффект: предупреждают заранее, объясняют, что запись поможет объективности, а не ищет «компромат», дают возможность сделать паузу, предлагают воды и т.д.. Тут технология пересекается с этикой: важно не только соблюсти букву закона, но и банально по-человечески не напугать собеседника тотальным контролем.

Обезличивание данных: хитрость или спасение?

Допустим, у компании накопились горы переписок и десятки часов интервью. Держать их страшно (вдруг утекут, и прилетит штраф), удалять жалко (там ценные инсайты!). Как быть?

Выход есть: обезличивание персональных данных. Это процесс, при котором из данных убираются или маскируются все идентификаторы, и больше нельзя понять, о ком шла речь (источник habr.com). Проще говоря, данные превращаются в анонимные, потеряв связь с конкретным человеком, но сохраняя пользу для анализа (источник selectel.ru).

Например, в Сбере пару лет назад встали перед задачей разметить массив документов для обучения моделей ИИ, но прямой доступ к документам вне офиса был запрещён из соображений безопасности. Тогда разработчики задумались: а нужны ли нам реальные фамилии и адреса клиентов для учебных выборок? Ответ оказался очевидным: нет, не нужны – если заменить их на правдоподобные фиктивные значения. Так появился проект по автоматическому обезличиванию документов. Вместо «Иванов Максим Викторович продал Петровой Марии автомобиль 24 апреля 2000 года» в текст подставляются вымышленные, но реалистичные данные той же структуры: «Максимов Иван Петрович продал Кузнецовой Дарье автомобиль 13 мая 2017 года».

Смысл и форма предложения сохранены, статистический анализ можно проводить, а настоящие люди не засвечены. Сберовцы признаются, что вручную убрать личные данные из одного документа – 10–15 минут работы, а вот обезличить тысячи страниц с сохранением морфологии и семантики – задача нетривиальная. Пришлось привлекать нейросети: алгоритмы NER (Named Entity Recognition) учатся находить имена, адреса, названия организаций, даты и другие сущности в тексте, после чего система замещает их на заранее заготовленные «фейковые» аналоги. Так автоматизация спасает от ручной рутины – и обеспечивает более надежное укрытие для персональных данных.

Обезличивание применяется не только к текстам, но и к аудио/видео. Правда, обезличить голос сложнее – по большому счёту, самый надёжный способ тут заменить голос текстом. То есть, сделать расшифровку интервью, а оригинальную аудиозапись удалить (или хранить отдельно под особым замком). Можно, конечно, попытаться изменить голос техническими средствами, но это не гарантирует юридической анонимности: тембр можно и распознать.

Поэтому компании часто идут по пути транскрибации. Видеоинтервью? Аналогично: либо размывать/замазывать лицо на видео до неузнаваемости, либо опять же хранить только текстовую версию беседы. Кстати, именно поэтому во многих исследованиях вместо имён фигурируют «респонденты №1, №2…»: это и есть примитивное обезличивание в действии.

Что говорит закон: 2025 и новые правила игры

Долгое время обезличенные (деперсонифицированные) данные в российском законе находились в серой зоне. Формально они всё ещё считались персональными, раз есть исходная база и «ключ» сопоставления. Юристы даже указывали: если изначальное согласие человека не предусматривало использование его данных в обезличенном виде, то и обезличивание не спасёт – такая обработка запрещена. Получалось, что обезличенные сведения висят в подвешенном статусе: человека уже не узнаешь, а лишние ограничения всё равно действуют.

Но в августе 2024 принят закон, который с 1 сентября 2025 года переломит ситуацию (источник habr.com). Новой статьёй 13.1 закона №152-ФЗ вводится чёткое определение обезличенных данных и, главное, разрешается их обработка без получения согласия гражданина. То есть, если вы надёжно обезличили собранные переписки или записи интервью – можете дальше использовать их для исследований, бигдата-проектов, обучения нейросетей без нарушения закона. Раньше формально требовалось согласие практически на любую операцию, теперь же прямо сказано: правильно анонимизированные данные – не требуют предварительного согласия. Конечно, обезличивание должно быть выполнено по правилам, исключающим идентификацию личности. Что именно считается достаточным уровнем обезличивания – тоже пропишут нормативно.

Роскомнадзор уже подготовил перечень допустимых методов (они во многом повторяют старый приказ 2013 года). Среди них: замена имен на коды (псевдонимизация), удаление или обобщение части сведений (например, оставить только регион вместо точного адреса), разбивка базы на несколько несвязанных частей, перемешивание записей и другие. Метод выбирают исходя из задач и характера данных. Если нужно отдать массив третьим лицам – предпочтительнее необратимое обезличивание, когда восстановить исходные сведения нельзя даже при большом желании. Так, в медицине требуют, чтобы данные пациентов для научных целей были анонимны: важен пол, возраст, диагноз, но имя или СНИЛС исследователю знать незачем.

Новые поправки также разрешают использовать обезличенные изображения лиц и голосовые записи без согласия – например, для видеоаналитики в городе. Камеры наблюдения смогут считать потоки людей, не храня персональные идентификаторы. Правда, есть нюанс: биометрию обезличивать для госнужд запретили – видимо, чтобы не было соблазна собрать всенародную базу «обезличенных» фото и голоса. Зато бизнесу, который хочет работать с биометрическими данными (например, анализировать записи звонков) и не возиться с каждым клиентом по отдельному согласию, новый закон даёт зелёный свет: обезличивайте – и вперёд. Без этого никуда: в будущем операторам данных придётся встроить стадию анонимизации в любой проект, иначе рискуют вообще потерять доступ к большим массивам информации.

Важно понимать: даже обезличенные данные требуют защиты. Если завтра утечёт база переписок, хоть и без имён, вряд ли организация отмажется: мол, это же не персональные данные. Во-первых, если обезличивание выполнили халатно, умельцы могут восстановить часть личности, скрестив утечку с другими источниками. Во-вторых, закон прямо говорит: меры защиты, обновление внутренних политик, обучение сотрудников – всё это распространяется и на анонимизированные сведения. Никакого «ура, можно расслабиться» быть не должно.

Например, метод псевдонимизации предполагает наличие таблицы соответствия кодов реальным людям – хранить такую таблицу нужно отдельно и железно ограничить к ней доступ. Роскомнадзор настаивает: документы с описанием методики обезличивания хранить отдельно, не разглашать даже внутри компании, кто и как «мешает данные». Иначе есть риск, что кто-то из инсайдеров зная алгоритм, сумеет откатить процесс назад. В общем, анонимизация – не панацея, а новый фронт работы. Но ничего не поделаешь: штрафы и риски слишком велики, чтобы игнорировать эту сферу.

TL;DR: Использовать, храня, обезличить

Итак, можно ли хранить переписки и записи интервью? Можно, если очень осторожно. Нужно помнить, что за каждой строчкой чата и каждым мегабайтом записи – чьи-то личные данные, а то и голос или образ. Их владельцы имеют полное право знать, что вы делаете с информацией об их жизни.

Поэтому – согласие, ограничение целей, ограничение сроков хранения, максимальная безопасность. Благо, современные законы уже начинают подыгрывать бизнесу: дают возможность обезличивать данные и дальше работать с ними без бюрократии. В идеале, грамотно обезличенные переписки и интервью – win-win решение: и пользу для анализа сохраняем, и приватность людей не нарушаем. На практике же это означает дополнительные усилия: инвестировать в технологии поиска и маскировки чувствительных сведений, переписывать внутренние политики, учить сотрудников правильно обезличивать и обращаться с такими данными.

Хорошая новость в том, что в мире больших данных эти усилия окупаются. Компания, научившаяся обращаться с данными деликатно, получает бесценный ресурс для развития – и не боится проверок. Обезличенные данные становятся полезным активом, который можно легально вовлекать в оборот. А уважение к праву на приватность клиентов и сотрудников формирует доверие к бренду. Секретные чаты и записи интервью могут быть золотой жилой инсайтов – если хранить их с умом и ответственностью.

Поэтому храните, но обезличивайте всё лишнее. Как говорится, «Данные – это новая нефть», а нефть, как известно, требует очистки перед использованием. Обезличивание данных – и есть такая очистка, превращающая сырые личные сведения в безопасное топливо для вашего бизнеса. И тогда переписка под колпаком перестаёт быть угрозой, а становится возможностью.