Ассоциация больших данных совместно со Сбером и другими участниками разработала проект национального стандарта по синтезу данных. Этот документ должен обеспечить надёжность, доступность и высокое качество информации для развития ИИ в стране.
Безопасный синтез данных
Будущий стандарт направлен на создание безопасных синтетических данных для обучения интеллектуальных систем. Он основан на методе дифференциальной приватности, который защищает конфиденциальные данные на всех этапах обработки. В проекте представлены математические обоснования того, что соблюдение стандартов исключает риски утечек информации.
Идеальный баланс: защита и качество
Одна из главных задач стандарта — найти баланс между защитой личных данных и качеством создаваемых датасетов. Это решение позволит добиться точности и безопасности, что особенно важно на фоне роста объёмов информации и ужесточения правил её хранения.
Анна Серебряникова, президент Ассоциации больших данных, подчёркивает, что новый стандарт сделает процесс синтеза данных прозрачным и надёжным. Синтетические данные могут стать полноценной альтернативой обезличенным данным, которые сейчас ограничены строгими регуляторами. Это создаст новые возможности для обучения ИИ и снизит риски.
Когда ждать нововведений
Уже в 2025 году проект стандарта планируют утвердить в Техническом комитете по стандартизации “Искусственный интеллект” (ТК 164). Этот шаг приблизит Россию к технологической независимости в сфере ИИ и обработки данных.




