ルネサスRA8M1 MCUを使用して強力で効率的なAIと機械学習を迅速に導入
著者 Kenton Williston 氏
DigiKeyの北米担当編集者の提供
2024-03-20
マルツ掲載日:2024-08-12
IoT向けに人工知能(AI)や機械学習(ML)、その他の計算集約的なワークロードをネットワークエッジに実装すると、マイクロコントローラ(MCU)に追加される処理負荷が大幅に増えていきます。設計者は消費電力を最小限に抑え、市場投入までの時間を短縮するよう求められていますが、こうした新しいワークロードを処理すると、消費電力が増加します。
設計者は、低消費電力ユースケースに特化した高性能な機能を追加しながら、MCUの効率性を維持するコンピューティングオプションを必要としています。このオプションはまた、音声制御や予知保全など、AIやMLによって実現される高度なアプリケーションをサポートするのに十分な機能を追加しつつも、従来のMCUに関連するシンプルな展開モデルを維持しなければなりません。
この記事では、AIとMLの需要を促進する要因について考察し、これらの機能を効率的に提供するために新しいプロセッサアーキテクチャが必要とされる理由について説明します。次に、これらの要件に対応する、ルネサスのRA8M1 MCUファミリをご紹介します。
エッジAIとMLの要件
AIとMLの需要は、ビルオートメーションや産業機器から家電に至るまで、エッジIoTアプリケーションで高まっています。比較的小型で低消費電力の組み込みシステムでも、キーワード検索、音声コマンド制御、音声/画像処理などのワークロードがかかっています。対象となるアプリケーションには、センサハブ、ドローンのナビゲーションと制御、拡張現実(AR)、仮想現実(VR)、通信機器などがあります。
プライバシーを確保しつつ、エネルギー使用量やオーバーヘッド、レイテンシを最小限に抑えるには、データをクラウドに送るよりもエッジで処理する方が望ましい場合が多いです。エッジデバイスは、特にバッテリ駆動の場合、リソースに制約があることが多いため、これは設計者にとって課題となります。
エッジコンピューティング向けのエンハンスドMCU
AIやMLのワークロードは通常、大規模なデータセットに対して同じ数学演算を繰り返し実行します。これらのワークロードは、単一命令複数データ(SIMD)処理による高速化が可能です。SIMDは、複数の数学演算を並列に実行し、従来の処理よりも大幅に高いスループットと優れた電力効率を実現します。
従来のMCUにはSIMD機能がないため、AIやMLワークロードを実行するにはサポートが必要です。1つの解決策は、デジタル信号プロセッサ(DSP)やその他のSIMDアクセラレータをMCUと一緒に使用することです。しかし、このマルチプロセッサアプローチはシステム設計を複雑にします。
もう1つの選択肢は、SIMD機能を搭載したより高性能なマイクロプロセッサユニット(MPU)に切り替えることです。これはシングルプロセッサのセットアップで必要な性能を実現できますが、MPUでは消費電力と機能セットで妥協する必要があります。
たとえば、すべてのMPUが、MCU指向のアプリケーションで要求される決定論的で低レイテンシのコンピューティングを実現するように設計されているわけではありません。
MCUでAIとMLを実現する
ルネサスは、AIやMLのワークロードをサポートする最適化されたMCUの必要性を認識し、RA8M1 MCUシリーズを発表しました(図1)。このシリーズは、Arm Cortex-M85アーキテクチャをベースにしており、HeliumとTrustZoneを搭載しています。480MHzで動作し、標準消費電力は225µA/MHzです。
図1:ルネサスのRA8M1 MCUはArm Cortex-M85をベースとし、AIとML処理を高速化するHeliumテクノロジーを搭載しています。(画像提供:ルネサス)
効率的な性能と低消費電力を目指して設計されたRA8M1 MCUは、決定性、短い割り込み時間、最先端の電源管理サポートなどの機能を備えています。このプロセッサは、6.39CoreMark/MHzの性能効率を達成しています。
Heliumは、信号処理とMLを大幅に高速化するSIMD M-Profile Vector Extension(MVE)です。150個のスカラ命令とベクトル命令が追加され、128ビットレジスタの処理が可能になります(図2)。リソースに制約のある低消費電力マイクロコントローラ向けに最適化されています。
たとえば、Heliumは新しいSIMDレジスタを導入するのではなく、浮動小数点ユニット(FPU)レジスタを再利用しています。これにより、プロセッサの消費電力を低減し、設計の複雑さを軽減することができます。
図2:HeliumはFPUレジスタバンクをベクトル処理に再利用しています。(画像提供:Arm)
図3に示すように、RA8M1のCortex-M85には、ArmのTrustZone技術が搭載されています。TrustZoneは、重要なファームウェア、資産、個人情報のためにハードウェアの分離を提供します。
Cortex-M85には、ポインタ認証や分岐ターゲット識別(PACBTI)拡張機能など、新しいセキュリティと安全機能が追加されています。これらのセキュリティ機能は、デバイスが個人データを扱う可能性があるAIの文脈では特に価値があります。
図3:Cortex-M85のTrustZoneは、重要なファームウェア、資産、個人情報のためにハードウェアの分離を提供します。(画像提供:Arm)
AI対応MCUに求められるハードウェア機能
MCUは、AIアプリケーションをサポートするために、効率的な性能と堅牢な機能セットを組み合わせる必要があります。RA8M1は、モータ制御、プログラマブルロジックコントロール(PLC)、メータリング、その他の産業用およびIoTアプリケーションに最適です。
たとえば、AIのアルゴリズムは大量のメモリを必要とします。RA8M1システムメモリには、最大2Mバイトのフラッシュと1MバイトのSRAMが含まれます。SRAMには128Kバイトの密結合メモリ(TCM)が含まれており、高性能計算のための高速メモリアクセスが可能です。
信頼性の高い動作を保証するため、384KバイトのユーザーSRAMと128KバイトのTCM全体がエラー訂正コード(ECC)メモリとして構成されています。32Kバイトの命令キャッシュとデータキャッシュもECC保護されています。
RA8M1には、Armコアに含まれるセキュリティ機能に加えて、複数のセキュリティ機能が組み込まれています。これには、安全なデータ処理のためのRSIP(Reprogrammable Secure Intellectual Property)暗号エンジン、重要データ保護のための不変ストレージ、改ざん防止メカニズムなどが含まれます。
通信インターフェースとして、MCUはネットワーク接続用のEthernet、車載および産業アプリケーション用のCAN FD(Controller Area Network Flexible Data Rate)、一般的な接続用のUSB High-Speed/Full-Speedを装備しています。また、カメラインターフェースと、外部メモリ用にオンザフライで復号化できるオクタルシリアルペリフェラルインターフェース(SPI)も内蔵しています。
アナログインターフェースには、12ビットのA/Dコンバータ(ADC)とD/Aコンバータ(DAC)、高速アナログコンパレータ、3つのサンプルアンドホールド回路が含まれます。
シリアル通信では、RA8M1はSPI付きシリアル通信インターフェース(SCI)、ユニバーサル非同期レシーバ/トランスミッタ(UART)、集積回路間(I²C)モードなど複数のプロトコルをサポートしています。MCUはまた、データ転送速度と効率を高める改良型集積回路間(I3C)モードも提供しています。
これらの入出力(I/O)機能にフルアクセスする必要がある開発者は、224ピンのR7FA8M1AHECBD#UC0のようなボールグリッドアレイ(BGA)パッケージを使用できます。
より合理化されたプリント回路基板(プリント基板)の設計と組立工程を求める場合は、144ピンのR7FA8M1AHECFB#AA0のような薄型クワッドフラットパッケージ(LQFP)オプションの使用を検討するかもしれません。
AIアプリケーションの開発環境
RA8M1シリーズの使用に興味のある設計者は、EK-RA8M1 R7FA8M評価ボードから始めることができます(図4)。このボードには、RJ45 RMII Ethernetインターフェース、USB高速ホスト・デバイスインターフェース、3ピンCAN FDヘッダが搭載されています。メモリには、64MバイトのオクタルSPIフラッシュを搭載しています。
図4:EK-RA8M1評価ボードには、RA8M1 MCUを動作させるための強力なI/Oサポートがあります。(画像提供:ルネサス)
RA8M1は、ルネサスのFlexible Software Package(FSP)でサポートされています。FSPは、組み込みシステム設計に使いやすく、拡張性があり、高品質なソフトウェアベースを提供するために設計された包括的なフレームワークです。
このパッケージは、人気の高いEclipse IDEをベースとしたe² studio統合開発環境(IDE)を含む開発ツールを提供します。また、ロイヤリティフリーの2つの代表的なリアルタイムオペレーティングシステム(Azure RTOSとFreeRTOS)も含まれています。
このパッケージには、組み込みシステムで一般的なユースケースをサポートする、生産ですぐに使用できる軽量なドライバが含まれています。これらのドライバと評価ボードを組み合わせることで、開発者はRA8M1 I/Oをすぐに使い始めることができます。
まとめ
RA8M1は、エッジIoTアプリケーションにAIとMLワークロードを実装するための新しいオプションを開発者に提供します。このオプションは、消費電力の削減、性能の向上、複雑性の軽減、市場投入までの時間の短縮を実現します。
免責条項:このウェブサイト上で、さまざまな著者および/またはフォーラム参加者によって表明された意見、信念や視点は、DigiKey Electronicsの意見、信念および視点またはDigiKey Electronicsの公式な方針を必ずしも反映するものではありません。
このページのコンテンツはDigiKey社より提供されています。
英文でのオリジナルのコンテンツはDigiKeyサイトでご確認いただけます。
DigiKey社の全製品は 1個からマルツオンラインで購入できます
ODM、OEM、EMSで定期購入や量産をご検討のお客様へ【価格交渉OK】
毎月一定額をご購入予定のお客様や量産部品としてご検討されているお客様には、マルツ特別価格にてDigiKey社製品を供給いたします。
条件に応じて、マルツオンライン表示価格よりもお安い価格をご提示できる場合がございます。
是非一度、マルツエレックにお見積もりをご用命ください。