compressionKITで常時稼働の エッジAIのメモリ課題を解決

目次

    推論処理が注目を集めていますが、継続的に生成されるセンサーデータは、メモリ、帯域幅、消費電力の制約要因となっています。compressionKIT™は、データ発生源でデータ量を低減することで、より効率的でスケーラブルなエッジAIシステムを実現します。

    Ambiq compressionKIT 1200 х 800
    compressionKITで常時稼働の エッジAIのメモリ課題を解決 7

    ここ数年のエッジAI開発により、推論効率が飛躍的に向上しました。かつてはサーバー級のハードウェアを必要としたモデルが、今ではナノサイズのチップ上で動作し、コイン電池程度の電力でミリ秒単位の推論を完了します。

    しかし、あまり注目されていないもうひとつのコスト要因があります。継続的に生成されるセンサーデータの処理に伴うオーバーヘッドです。

    常時稼働のデバイスは推論を実行するだけではなく、絶え間なくデータを生成します。PPGデータをストリーミングするスマートウォッチは、心拍の合間に動作を停止することはありません。心電図パッチもスリープ状態になりません。スマートリング、ヒアラブル、その他のセンサーは、保存、送信、処理が必要なデータを継続的に生成します。

    これはシステムレベルの負担となります:

    • ローカルに保存されたデータは、すぐに限られたメモリを埋めてしまう
    • 無線で送信することで、電力消費の大きな要因となる
    • クラウドに送信されるデータが、帯域幅やインフラコストを増大させる

    規模が大きくなると、これらのコストは数百万台のデバイスにわたり蓄積し、推論そのものの実行コストに匹敵するか、それを上回ることも少なくありません。

    compressionKITは、この課題に対するAmbiqの答えです。 AIベースのコーデックで、データが保存、送信、分析される前に、ソースで連続センサーストリームを圧縮し、下流の処理に必要な信号構造を保持します。以下のデモ動画をご覧いただくか、技術概要をご覧ください:

    compressionKIT の仕組み

    compressionKITは、実環境の信号条件に基づいて学習されたモデルを使用して、生のセンサーデータをコンパクトな表示にエンコードします。一定の数学的変換を適用する代わりに、信号のどの部分に意味のある情報が含まれているかを学習し、圧縮時にそれらの特徴を保持することを優先します。

    デコーダは、選択された圧縮レベルに基づいて信号を再構成します。圧縮レベルは、ロスレスに近いものから、下流の処理に必要なコア波形構造を保持しつつ、非常にコンパクトな表示まで、対応しています。

    圧縮率と忠実度のコントロール

    圧縮率は調整可能で、目標値は2倍から16倍(エントロピー符号化では最大20倍)です。各ステップはデータ量を削減する一方で、再構成誤差を発生させます。

    このトレードオフを、再構成された信号が元の信号からどれだけ乖離しているかを示す指標であるPRD(Percent Root-Mean-Square Difference:二乗平均平方根差率)を用いて評価します:

    • 2倍圧縮:誤差は約4.8%で、視覚的にはオリジナルと区別できない
    • より高い圧縮レベル:誤差は増大するが、コアの信号構造は維持される

    これにより、開発者はアプリケーションに応じて、データサイズ、信号品質、システム制約の適切なバランスを選択することができます。

    image 5
    compressionKITで常時稼働の エッジAIのメモリ課題を解決 8

    16倍圧縮の場合、誤差は約11%に増加しますが、基本的な信号構造はそのままで、送信データ量を約95%削減し、大幅な省電力化を実現します。

    image 7
    compressionKITで常時稼働の エッジAIのメモリ課題を解決 9

    BLE伝送はウェアラブルデバイスで最も電力を消費するものの1つとなることが多いため、データ量の削減はバッテリー寿命の延長に直結します。臨床グレードのウェアラブルや診断用パッチなど、信号の忠実度が重要なアプリケーションでは、圧縮率を低く設定することで、5%以下の誤差を維持しながら、帯域幅とメモリを大幅に削減することができます。

    ノイズ除去も行う圧縮

    AIベースのコーデックの主な利点の1つは、ノイズを処理する能力です。

    従来のコーデックは、意味のある構造も不要なアーチファクトも含め、信号に含まれるすべての要素を圧縮します。これに対し、compressionKITは、さまざまなノイズ条件を含む実環境のデータを用いて学習しているため、保存すべき信号の特徴と除去可能なノイズを区別することができます。

    その結果、圧縮とノイズ除去が1回の処理で完了し、追加の処理段階や計算は必要としません。

    ライブデモでは、入力PPGにベースラインの変動とガウスノイズを加えると、明らかに波形が劣化します:

    image 3
    compressionKITで常時稼働の エッジAIのメモリ課題を解決 10

    再構成された出力はクリーンなままでした:

    image 4
    compressionKITで常時稼働の エッジAIのメモリ課題を解決 11

    ノイズ除去のための別段の処理や追加の計算は不要で、コーデックが両方を同時に処理します。モーションアーチファクトや電気的干渉が常に発生する実環境で動作するウェアラブルにとって、これは従来の固定変換方式と比較して明らかな利点となります。

    導入の柔軟性

    compressionKITは、効率的なオンデバイス導入のためのハイブリッドDSP + MLアプローチと、最大限のデータ削減のためのAIファーストのニューラル圧縮モードという2つの実装経路をサポートしています。

    これらの圧縮された表示は、さまざまな方法で使用することができます:

    • 圧縮データをオンデバイスで直接推論
    • より詳細な分析とモデルの改良のための圧縮されたクラウドへのアップロード
    • レイテンシ、消費電力、演算のバランスをとるハイブリッドのエッジクラウド・パイプライン

    この柔軟性は、長期的な健康アプリケーションやセンシングアプリケーションを構築するチームにとって特に重要です。

    継続的なセンサーデータは、保存コストが高く、大規模な送信は速度が遅くなります。compressionKITは、データをソースで圧縮することで、数週間から数ヶ月の連続データという長期間のモニタリングを、ストレージと帯域幅のコストを大幅に削減して実現します。

    オンデバイスの性能

    compressionKITには、AmbiqのハードウェアからUSB経由でデータを直接ストリーミングするライブダッシュボードが搭載されており、チームは、事前に記録されたデータセットだけでなく、各自のデバイスを使用して圧縮および再構成された信号をリアルタイムで評価することができます。

    代表的な性能(デモ):

    • エンコードレイテンシ:4.1ミリ秒
    • 消費電力:推論あたり31.7mW
    • メモリフットプリント:約21 KB
    image 6
    compressionKITで常時稼働の エッジAIのメモリ課題を解決 12

    この規模であれば、compressionKITは既存のセンサー処理パイプラインに統合でき、システムのスケジューリングやリソースバジェットへの影響は最小限に抑えることができます。

    信号サポートと利用可能性

    compressionKITは、エッジAIにおけるより広範な転換を反映しています。推論だけでなく、センサーから洞察にいたるデータパイプライン全体を最適化します。

    メモリ、帯域幅、電力などあらゆる面で継続的なデータのコストを削減することで、より実用的な常時稼動システムを実現し、大規模で長期間のセンシングを可能にします。

    これは、以下のような幅広いユースケースに適用されます:

    • 生理信号(PPG、心電図)
    • モーションセンシング(加速度計)
    • 音声およびその他の連続データストリーム
    • 新たなマルチモーダルエッジAIシステム

    現在のリリースでは、ウェアラブルデバイスで最も一般的な信号であるPPG、心電図、加速度計のデータに焦点を当てています。

    compressionKITは現在ベータ版を開発中で、Ambiqは初期パートナーと協力して、実環境のセンサーデータや製品の制約条件を用いた性能評価を行っています。

    compressionKITは、推論だけでなくデータのコストにも対処することで、エッジAIを個別のユースケースからスケーラブルな常時稼働するインテリジェンスへと移行させるのに役立ちます。

    compressionKITの詳細については、プレスリリースをご参照いただくか、弊社ウェブサイトをご覧ください。

    ベースラインは生データの非圧縮伝送を前提としています。結果は、Apollo510を使用して、4秒間のウィンドウで64Hzのサンプリングレートで取得した2チャンネルPPGを測定しました。報告されている圧縮は、compressioKITモデルによる固定16倍圧縮と動的エントロピーエンコーダを組み合わせたもので、1分間のデータで最大20倍の平均圧縮率を実現しています。20倍のデータ圧縮率は確定的なものではありません。

    ニュースレターを購読する

      ダウンロードの準備