Український клуб штучного інтелекту: Чи справді DeepSeek передає дані Китаю?

Минулого тижня китайський стартап DeepSeek справив справжній фурор у світі штучного інтелекту завдяки своїй економічній та водночас високопродуктивній відкритій версії моделі DeepSeek-R1.

Ця модель використовує навчання RL , щоб конкурувати з o1 від OpenAI за низкою стандартів, кидаючи виклик поширеній думці, що для високопродуктивного ШІ потрібні великі ресурси та потужні чіпи. Однак з моменту виходу цієї моделі виникло багато запитань, зокрема щодо можливості передачі персональних даних користувачів до Китаю.

Перші побоювання виникли через політику конфіденційності компанії. Незабаром проблема набула великого розголосу, і співробітник OpenAI, Стівен Хайдл, натякнув, що американці «люблять віддавати свої дані» китайській Комуністичній партії в обмін на безкоштовні послуги.

Ці звинувачення є важливими з точки зору безпеки, але насправді DeepSeek може зберігати дані тільки на китайських серверах, якщо модель використовується через їхній власний сервіс, схожий на ChatGPT.

Якщо відкриту модель хостити локально або через GPU в США, дані не потрапляють до Китаю.

Побоювання щодо політики конфіденційності DeepSeek

У політиці конфіденційності, яка, до того ж, на деякий час була недоступна, DeepSeek зазначає, що компанія збирає інформацію різними способами, включаючи реєстрацію на її послуги чи їх використання. Це означає, що всі дані, від налаштування облікового запису (імена, електронні адреси, номери телефонів та паролі) до даних про використання (тексти, аудіопідказки, завантажені файли, відгуки та історія чатів) потрапляють до компанії.

Але це ще не все. Політика також стверджує, що зібрана інформація буде зберігатися на безпечних серверах у Китайській Народній Республіці і може бути передана правоохоронним органам, державним органам та іншим установам з метою розслідування незаконної діяльності або для виконання вимог законодавства чи урядових запитів.

Це важливо, оскільки китайські закони щодо захисту даних дозволяють уряду конфіскувати дані з будь-якого сервера в країні з мінімальними підставами.

З таким обсягом даних на китайських серверах можуть виникнути різноманітні ризики, зокрема профілювання осіб і організацій, витік чутливої бізнес-інформації та навіть кампанії з кіберспостереження.

Підступність

Попри те, що політика конфіденційності може викликати серйозні тривоги з приводу безпеки (як це вже сталося у багатьох), важливо зазначити, що вона стосується лише сервісів DeepSeek — додатків, вебсайтів та програмного забезпечення, що працюють через модель R1 у хмарі.

Якщо ви зареєструвалися на сайті DeepSeek Chat або користуєтесь їхнім AI-асистентом на Android чи iOS, є велика ймовірність, що ваші пристрої передають особисті дані та підказки на китайські сервери.

Компанія не надавала офіційної заяви з цього приводу, але враховуючи, що додаток DeepSeek для iOS став популярним, випередивши навіть ChatGPT, можна припустити, що багато людей вже зареєструвались для тестування асистента і таким чином поділилися своїми даними.

Android-додаток також перевищив мільйон завантажень.

DeepSeek-R1 є відкритим кодом

Що стосується основної моделі DeepSeek-R1, то тут не йдеться про передачу даних.

R1 є повністю відкритим кодом, що означає, що команди можуть запускати його локально для своїх цілей за допомогою інструментів для реалізації з відкритим кодом, таких як Ollama. Це дозволяє моделі виконувати свою роботу ефективно, обмежуючи дані лише до самого пристрою. Згідно з Емадом Мостааком, колишнім засновником та CEO Stability AI, модель R1-distill-Qwen-32B може працювати без проблем на нових Mac з 16 ГБ відеопам'яті.

Як альтернативу, команди можуть використовувати GPU-кластери від сторонніх оркестраторів для навчання, налаштування та розгортання моделі — без ризиків передачі даних. Одним з таких є Hyperbolic Labs, що дозволяє орендувати GPU для хостингу R1. Компанія також надає доступ до моделі через захищений API.

Таким чином, якщо ви хочете просто поговорити з DeepSeek-R1 для вирішення певної задачі, найкраще використовувати Perplexity. Компанія нещодавно додала R1 до свого вибору моделей, дозволяючи користувачам здійснювати глибокі дослідження в Інтернеті з логічним мисленням.

Згідно з АрАвіндомом Срінівасом, CEO Perplexity, компанія реалізувала цей варіант, хостячи модель на серверах дата-центрів у США та Європі.

Ваші дані будуть у безпеці, якщо модель DeepSeek-R1 буде хоститися локально, будь то на вашому пристрої чи на GPU-кластерах на заході.

Авторка: Дар’я Бровченко

Український клуб штучного інтелекту

четвер, 30 січня 2025 р.

Чи справді DeepSeek передає дані Китаю?

Побоювання щодо політики конфіденційності DeepSeek

Підступність

DeepSeek-R1 є відкритим кодом

Немає коментарів:

Дописати коментар

Архів блогу

Загальна кількість переглядів сторінки

четвер, 30 січня 2025 р.

Чи справді DeepSeek передає дані Китаю?

Побоювання щодо політики конфіденційності DeepSeek

Підступність

DeepSeek-R1 є відкритим кодом

Немає коментарів:

Дописати коментар

четвер, 30 січня 2025 р.