Чотири ключові уроки щодо безпеки й керування моделлю машинного навчання
Своїм баченням з нами ділиться Зохар Сакс, старший директор із продуктів JFrog. Отже…
«Оскільки Gartner оцінює, що до 2027 року понад 90% новостворених бізнес-програмних додатків міститиме моделі або послуги машинного навчання, очевидно, що революція ML з відкритим кодом триває. Застосовуючи правильні процеси MLOps і використовуючи уроки, засвоєні в результаті революції DevOps, організації можуть з упевненістю орієнтуватися в просторі ML з відкритим кодом і пропрієтарним кодом. Такі платформи, як JFrog, які включають можливості керування моделлю ML, можуть додатково підтримати організації на шляху до успішного впровадження.
Відтоді, як Річард Столман у 1983 році випустив перший пакет із відкритим вихідним кодом із проекту GNU, відбулася величезна еволюція відтворюваності, надійності та міцності програмного забезпечення. Такі концепції, як керування життєвим циклом розробки програмного забезпечення (SDLC), ланцюжок постачання програмного забезпечення (SSC) і керування життєвим циклом випуску (RLM), стали наріжним каменем того, як керувати та захищати середовища розробки програмного забезпечення.
З точки зору MLOps, ось чотири уроки, які охоплюють теми, які стосуються моделей AI, зокрема:
- Відстежувані схеми управління версіями
- Кешування артефактів і доступність
- Ліцензування моделі та набору даних
- Пошук надійних репозиторіїв ML з відкритим кодом
Розробникам ШІ та професіоналам MLOps необхідно ознайомитися з цими уроками щодо керування та захисту середовищ розробки ML.
Оскільки підприємства все більше використовують моделі та послуги машинного навчання, стає вкрай важливим використовувати пакети з відкритим кодом, одночасно забезпечуючи безпеку та відповідність вимогам. Моделі та набори даних з відкритим вихідним кодом пропонують численні переваги, але вони також мають свої проблеми та ризики. Тут ми розглянемо деякі ключові уроки, отримані з революції DevOps, і побачимо, як їх можна застосувати для успішного впровадження моделей ML з відкритим кодом.
Урок 1. Прийміть чітку схему керування версіями, яку можна відстежувати
Керування версіями дозволяє організації бути впевненою, що програмне забезпечення, яке вони створюють, використовує правильні частини. Завдяки хорошому керуванню версіями ви можете повернути невдале розгортання та вимагати менше виправлень для реальних клієнтів, які стикаються з помилками в програмі.
У традиційному світі розробки програмного забезпечення семантичне керування версіями (SemVer) є стандартом. Семантичне керування версіями є дуже потужним інструментом, але може відображати лише одну часову шкалу. За допомогою семантичного керування версіями ви можете визначити теперішнє та минуле, а також порядок між ними.
Однак коли справа доходить до керування версіями моделі ML, ситуація значно інша. Хоча збірки програмного забезпечення з однаковими вхідними даними мають бути узгодженими, у моделях ML два послідовних тренування можуть призвести до абсолютно різних результатів. У навчанні моделі ML схеми управління версіями мають багато вимірів. Навчання може проводитися паралельно, використовуючи різні параметри або дані, але зрештою всі результати навчання вимагають перевірки. Ваша схема керування версіями має містити достатньо метаданих, щоб Data Scientist, DevOps, ML Engineers і SRE могли легко зрозуміти вміст версії. Хоча багато інструментів ML використовують певну форму семантичного керування версіями, JFrog використовує інший підхід до керування версіями моделі ML, який краще враховує складність розробки моделі ML і багато зацікавлених сторін, залучених до процесу.
Урок 2. Кешуйте кожен артефакт, який ви використовуєте, оскільки він може зникнути
Не на всі проекти з відкритим вихідним кодом можна довго розраховувати. Деякі можуть закритися, тоді як в інших випадках компанії можуть припинити підтримку створених ними пакунків, що означає, що остання версія може працювати не так добре, як попередня.
Щоб захиститися від такого типу нестабільності, під час роботи з моделями ML рекомендується кешувати все, що ви використовуєте як частину навчання або висновку. Це включає: модель, пакети програмного забезпечення, контейнер, у якому ви його запускаєте, дані, параметри, функції тощо. Навіть сама модель ML є частиною програмного забезпечення, тому доцільно також кешувати всі ці пакети. На ринку є різні інструменти кешування, включаючи JFrog Artifactory з підтримкою моделі ML, що охоплює найпопулярніші типи пакетів ML.
Урок 3 – Процедури ліцензування моделі та набору даних
Відкритий код не означає безкоштовний! Більшість моделей із відкритим вихідним кодом мають ліцензійну угоду, яка визначає, що ви можете, а що не можете робити. Ліцензування є дуже складною сферою, і ви можете проконсультуватися з юридичним експертом, перш ніж вибрати модель із ліцензією, яка може поставити під загрозу активи вашої компанії. На ринку існують інструменти для забезпечення відповідності вимогам ліцензування, наприклад JFrog Curation і JFrog Xray , які гарантують, що ваші ліцензії на програмне забезпечення відповідають політиці компанії.
Урок 4. Використовуйте моделі ML з відкритим кодом лише з надійних джерел
Інтегруючи відкрите програмне забезпечення у ваше програмне забезпечення, ви фактично довіряєте розробнику програмного забезпечення підтримувати якість, безпеку та рівні обслуговування, необхідні для безперебійної роботи вашого програмного забезпечення. На жаль, досить часто використовують пакунки з відкритим вихідним кодом, щоб пізніше виявити критичну помилку, і супроводжувач не може її вирішити. В крайньому випадку, ви можете використати власні ресурси розробки, щоб проникнути в код і почати його виправляти – зрештою, це програмне забезпечення з відкритим вихідним кодом – але насправді це легше сказати, ніж зробити, і навіть гірше, потрібні ресурси для підтримки коду в робочому стані.
Підприємствам необхідно розробити набір правил, які визначають, чи є пакет або модель з відкритим вихідним кодом достатньо зрілими для використання їх розробниками. Рекомендації JFrog радять принаймні переглянути кількість учасників і дату останнього випуску, а також іншу відповідну інформацію. Платформа JFrog може допомогти в цьому шляхом автоматизації політик, щоб зробити життя ваших розробників простішим і продуктивнішим.
Тож тепер з упевненістю приєднуйтесь до революції машинного навчання з відкритим кодом
Коли справа доходить до моделей ML, керування версіями стає складнішим через численні виміри, залучені до навчання та перевірки. Кешування кожного використаного артефакту стає важливим для пом’якшення ризиків, пов’язаних із нестабільністю проектів з відкритим кодом.
Важливо також враховувати рівень якості, безпеки та обслуговування, наданий розробником програмного забезпечення, беручи до уваги критичні помилки, які можуть бути виявлені в подальшому, вимагаючи від компаній виділяти власні ресурси для обслуговування.
Переймаючи уроки, отримані в результаті революції DevOps, і застосовуючи їх до ландшафту ML з відкритим кодом, професіонали MLOps можуть краще орієнтуватися в викликах і використовувати переваги моделей ML ефективно, безпечно та ефективно.
Застосування правильних процесів MLOps сьогодні забезпечить вам успіх завтра. Ознайомтеся з можливостями JFrog щодо керування моделлю машинного навчання та ключовими галузевими партнерствами, щоб на власні очі побачити, як вони можуть підтримувати та вдосконалювати ваші операції розробки машинного навчання.»
Залишається додати, що партнер JFrog, компанія Ідеалсофт, пропанує акційні умови придбання рішень JFrog. Тож щоб не пропустити такі акційні пропозиції, слідкуйте за новинами на сайті компанії. Також Ідеалсофт може запропонувати демонстрацію цих рішень з боку розробника.