Люди використовують продукти Raspberry Pi для створення проектів штучного інтелекту майже стільки ж, скільки ми створюємо їх. Оскільки ми поступово випускаємо потужніші пристрої, ми розширюємо діапазон додатків, які ми можемо природньо підтримувати від початку; але в будь-якому поколінні завжди будуть деякі робочі навантаження, для яких потрібен зовнішній прискорювач, як-от Raspberry Pi AI Kit, який ми запустили в червні.
Raspberry Pi AI Kit — це надзвичайно потужне обладнання, здатне виконувати тринадцять трильйонів операцій за секунду. Але він сумісний лише з Raspberry Pi 5 і вимагає окремого модуля камери для захоплення візуальних даних. Тому ми дуже раді повідомити про нове доповнення до нашої лінійки продуктів камери: Raspberry Pi AI Camera.
Камера AI Camera побудована на основі датчика зображення Sony IMX500 із вбудованим прискорювачем AI. Він може запускати широкий спектр популярних моделей нейронних мереж із низьким енергоспоживанням і низькою затримкою, залишаючи процесор вашого Raspberry Pi вільним для виконання інших завдань.
Головні характеристики Raspberry Pi AI Camera включають в себе:
- Інтелектуальний датчик бачення Sony IMX500 на 12 МП
- Сенсорні режими: 4056×3040 на 10fps, 2028×1520 на 30fps
- Комірка розміром 1.55 µm × 1.55 µm
- Можливість огляду 78 градусів із ручним налаштуванням фокусу
- Інтегрований RP2040 для нейронної мережі та керування прошивкою
Камеру AI можна підключити до всіх моделей Raspberry Pi, включаючи Raspberry Pi Zero, за допомогою наших звичайних стрічкових кабелів для камер.
Використовуючи набір інструментів штучного інтелекту від Sony, існуючі моделі нейронних мереж, що використовують фреймворки, такі як TensorFlow або PyTorch, можна конвертувати для ефективної роботи на камері штучного інтелекту. Крім того, нові моделі можуть бути розроблені таким чином, щоб використовувати переваги специфічних можливостей прискорювача ШІ.
Заглянемо всередину :
Щоб скористатися вбудованим прискорювачем AI, ми повинні спочатку завантажити модель. На старих пристроях Raspberry Pi цей процес використовує протокол I2C, тоді як на Raspberry Pi 5 ми можемо використовувати набагато швидший спеціальний двопровідний протокол. Кінець каналу з камерою керується вбудованим мікроконтролером RP2040; під’єднаний флеш-пристрій на 16 МБ зберігає в кеш-пам’яті нещодавно використані моделі, що дозволяє нам у багатьох випадках пропускати крок завантаження.
Після того, як сенсор розпочав потокову передачу, IMX500 працює як стандартний датчик зображення Bayer, схожий на датчик Raspberry Pi Camera Module 3. Інтегрований процесор сигналу зображення (ISP) виконує основні кроки обробки зображення на рамі датчика (головним чином Bayer-to-RGB : перетворення і обрізання/зміна масштабу) і подає оброблений кадр безпосередньо в прискорювач AI. Після того, як модель нейронної мережі обробила кадр, його вихідні дані передаються на хост Raspberry Pi разом із кадром Bayer через шину камери CSI-2.
Інтеграція з камерою Raspberry Pi
Ключовою перевагою камери зі штучним інтелектом є бездоганна інтеграція з нашим пакетом програмного забезпечення камери Raspberry Pi. Всередині libcamera обробляє кадр Bayer за допомогою нашого власного провайдера, так само, як і для будь-якого датчика.
Ми також аналізуємо результати нейронної мережі, щоб створити вихідний тензор і синхронізувати його з обробленим кадром Байєра. Обидва вони повертаються до програми під час етапу завершення запиту libcamera.
Фреймворки камер Raspberry Pi — програми Picamera2 і rpicam, а також будь-яка програма на основі libcamera — можуть отримувати вихідний тензор, правильно синхронізований із кадром датчика. Ось приклад нейромережевої моделі виявлення об’єктів (MobileNet SSD), яка працює в додатках rpicam і виконує висновки щодо відео 1080p зі швидкістю 30 кадрів в секунду.
Ця демонстрація використовує структуру постобробки в програмах rpicam для генерації обмежувальних рамок об’єктів із вихідного тензора та малювання їх на зображенні. Для реалізації цього етапу потрібно не більше 300 рядків коду. Еквівалентна програма, створена за допомогою Python і Picamera2, потребує набагато менше рядків коду.
Інший приклад нижче показує модель нейронної мережі, що оцінює пози (PoseNet), і яка виконує висновки щодо відео 1080p зі швидкістю 30 кадрів в секунду.
Незважаючи на те, що ці приклади були записані за допомогою Raspberry Pi 4, вони працюють з такою ж продуктивністю логічного висновку на Raspberry Pi Zero!
Разом із Sony ми випустили низку популярних моделей візуальних нейронних мереж, оптимізованих для камери штучного інтелекту в нашому "модельному зоопарку", а також приклади сценаріїв візуалізації за допомогою Picamera2.
І який же пристрій мені купити?
Вам варто купити набір Raspberry Pi AI Kit або камеру Raspberry Pi AI? Набір штучного інтелекту має вищу теоретичну продуктивність, ніж камера штучного інтелекту, і може підтримувати більший діапазон моделей, але сумісний лише з Raspberry Pi 5. Камера штучного інтелекту компактніша, має нижчу загальну вартість в тому випадку, якщо у вас ще немає камери камери, а також вона сумісна з усіма моделями Raspberry Pi.
Зрештою, обидва продукти забезпечують чудову продуктивність прискорення для звичайних моделей, і обидва були оптимізовані для безперебійної роботи з нашим стеком програмного забезпечення камери.
Починаємо і просуваємось далі
Перегляньте наш посібник з початку роботи. Там ви знайдете інструкції щодо встановлення апаратного забезпечення AI Camera, налаштування програмного середовища та запуску прикладів і нейронних мереж у нашому модельному зоопарку.
На веб-сайті розробників AITRIOS від Sony є більше технічних ресурсів щодо датчика IMX500, зокрема конвертер IMX500 та документація пакета IMX500, яка буде корисною для користувачів, які хочуть запускати спеціально навчені мережі на камері зі штучним інтелектом.
Нас надихнули неймовірні проекти штучного інтелекту, які ви створювали протягом багатьох років із Raspberry Pi, і ваша наполеглива праця та винахідливість заохочують нас інвестувати в інструменти, які допоможуть вам піти далі. Поява спочатку AI Kit, а тепер AI Camera відкриває цілий новий світ можливостей для високоякісного візуального AI з високою роздільною здатністю, високою частотою кадрів: ми не знаємо, що ви збираєтеся створити з ними, але ми впевнені, що це буде чудово.