雑誌無償購読申込み 最新号 バックナンバー 広告資料請求 EDN Japanについて お問合せ
雑誌無償購読申し込み
メールニュースレター登録
登録内容変更
アナログ IC/ディスクリート
電源/電池/コントローラー
PLD / メモリー
組み込みシステム
コンピュータ&ボード
EDA/IP/CAE/ソフトウェア
電子部品
計測器
ディスプレイ
デジタル家電
通信・ネットワーク
カーエレクトロニクス/産業機器
EDN Japan 記事検索
検索方法の詳細
雑誌無償購読申込み ニュースレター登録 この記事に対する感想/ご意見
2006.1
映像/画像処理技術の本命を狙うマルチコア
――マイクロプロセッサフォーラムジャパンから

鴨川 学、伊藤 達哉 EDN Japan編集

Advertisement
 2005年11月16日から3日間、東京国際フォーラムにおいて「第1回 マイクロプロセッサ フォーラム ジャパン」が開催された。これはマイクロプロセッサ専門の調査レポート「Microprocessor Report」を発行する米In-Stat社が、毎年春と秋に米国で開催しているものの日本版で、今回が初めての開催になる。直前に開催された米国のFall Processor Forum(FPF)と同じ講師による最新技術発表の他に、日本オリジナルのプログラムも交えた内容の聴講に、3日間でのべ400人の技術者達が集まった。「マルチコア」をテーマとした今回のフォーラムでは、日本独自の基調講演として東芝が「Cellの狙いと今後の戦略」について語り、NECエレクトロニクスは「携帯電話機に向けたマルチコア技術」への取り組みを語った。また、米ARC International社はFPFでは講演しなかった「ARC750Dコアに向けたSIMD(Single Instruction Multiple Data)拡張命令セット」の詳細を明らかにした。

スーパーコンピュータ級の処理能力を民生へ

東芝セミコンダクター社
斉藤光男氏
 東芝セミコンダクター社の首席技監 斉藤光男氏(写真)は、米IBM社、ソニーグループと共に共同開発した「Cell Broadband Engine」の狙いと今後の戦略について語った。斉藤氏は、講演の中でブロードバンドを「プロセッサの内部バスよりも広帯域のバンド幅をもつネットワーク」と位置づけた上で、「Cellにより、ブロードバンド時代に向けてデジタルホームから分散コンピューティングまで適用できるアーキテクチャの提供を目指す」と述べた。同氏はCellを「スーパーコンピュータをワンチップに収めたもの」と表現し、今後は日常生活における身近な電子機器にもスーパーコンピュータ並みの処理能力を搭載していきたい考えだ。
 ハイエンドのサーバー、コンピュータ分野に強いIBM社、デジタル家電分野に強い東芝、エンターテインメント分野に強いソニー。それぞれ異なる強みを持つ三社の共同開発では、当初は文化の違いにより生じる問題も多々あったという。しかし、「マルチメディアに特化したプロセッサを開発する」という共通の目標を設定した後は、強い協力体制を築き、比較的スムーズに開発が進めることができたと明かした。
 通常、ソフトウエアで処理するよりもハードウエアで演算処理する方が処理速度は速いが、Cellにはソフトウエアでデータを並列演算することでハードウエア並みの処理速度を実現する狙いがある(図1)。「ソフトウエアを駆使するため拡張性や柔軟性が高い」としている(同氏)。
図1 リファレンスソフトウェアの構造

 Cellは、汎用処理に向いたPowerPCアーキテクチャのCPUコアであるPPE(Power Processor Element)、SIMD型のメディア処理用のプロセッサコアである8個のSPE(Synergistic Processor Element)、Cell内部の各ブロックを接続する高速広帯域な内部リンクバスであるエレメント・インターフェース・バス、XDRに対応した2系統のメモリーインターフェース、外部のGPUやチップとの連携をとるI/Oインターフェース、などで構成される(図2)。
図2 Cell Broadband Engine基本構成

 8個のSPEはそれぞれキャッシュメモリーを持たず、ローカルストレージを持つ。このためユーザーがデータ全体の流れを把握しておく必要があるものの、個々のSPEの動作を把握でき、全体の動作を予測できるため、高速化に向くという。
 講演では、CEATEC Japan 2005で実演して注目を集めた、人の顔を3次元的に認識し化粧や髪型をリアルタイムに合成できる「デジタル鏡」や、MPEG-2のビデオ信号を48ストリーム同時に再生する事例をデモで紹介した。
 マルチコアプロセッサではソフトウエアの作成が難しくなるのではないかという質問が出たが、これに対して斉藤氏は、「今後、ソフトウエアの標準化活動を展開し、開発環境を整えていく」と語った上で、「プログラミングは実際にはそれほど大変なものではない」とコメントした。

マルチスレッドに進化するNECエレの戦略

NECエレクトロニクス
山品正勝氏
 NECエレクトロニクスの、携帯電話機向けマルチコアプロセッサの戦略が明らかになった。現在量産中のTask Parallel方式の「MP211」に続き、SMP(Symmetric Multi Processor)方式の「MPCore」、続いてCFP(Control Flow Parallel)方式の製品を開発していく(図3)。同社モバイルシステム事業部長の山品正勝氏(写真)が基調講演で述べたもの。
 MP211はARM926コアを3個、MPCoreはARM11を4個集積して処理速度を上げている。CFPの製品はマルチスレッドで自動的に並列処理できる。
 同氏は、今後の携帯電話機にはマルチコアプロセッサが不可欠と述べた。その理由は、「低消費電力化」「ソフト開発の効率化」の2点。シングルコアで今後の高機能化に対応するにはCPUの動作速度を上げていくしかない。その場合、高速化による消費電力の増大に加え、高速動作可能なプロセスはリーク電流が非常に大きいという問題がある。マルチコア化によって動作周波数を低下させればこれらの問題が回避できる。
図3 NECエレのマルチコア技術ロードマップ

 ソフト開発が時間的にも金銭的にも製品開発の大半を占めつつあるのは衆知のとおりである。マルチコアを使用すれば、例えば廉価機の機能を備えたプロセッサに、さまざまなアプリケーションの処理機能を搭載したプロセッサを加えることで効率的に高機能機を実現できる。同氏は今後高機能なW-CDMA方式の携帯電話機出荷が世界的に大幅に伸びるという見通しを述べた。
 MP211は「並列処理による最適な性能の実現」をコンセプトに開発された。3個のARM926コアに加え、MSE(Mobile Security Engine)にもCPUを搭載している(図4)。低消費電流化に向けて、動的クロックゲーティングと自動周波数制御(AFM)を採用した。動的クロックゲーティングでは、動作状態によって動的にクロックをオン/オフする。この技術により、消費電流を83mAから44mAまで削減できた実例があるという。AFMでは動作状態を内部回路がモニターし、PLLの出力を動的に制御する。AFMを最も効率的に使用した場合として、消費電力を半分以下まで削減できた例を示した。
図4 MP211のブロック図

 SMP方式では、タスクの自動スケジューリングが可能になる。MPCoreはARM11コアを4個搭載している。製造プロセスは130nmで、動作周波数は300MHz。3.5世代HSDPA方式携帯電話機での採用を見込んでいる。現在サンプル出荷中(図5)。
図5 MPCoreの概要

 CFP方式は、スレッドレベルでの自動並列化が可能である。現在開発中の製品はコアを3個搭載している(図6)。現在サンプルを使って評価中で、今後の課題として「コスト」、「ソフトウエア開発」を挙げ、ソフトウエア開発における課題の一例としてメモリーへの読み出し/書き込みの競合によるメモリーデータハザードへの対応例を示した。サンプル提供は「近いうちに実現する」とした。
図6 CFP製品の概要


ARC社、SIMD技術とマルチコア技術への注力を表明

ARC International社
Nigel Topham氏
 ARC社は、プロセッサの性能向上に向けて、SIMD技術およびマルチコア技術の開発に注力する。同社のチーフ・アーキテクトを務めるNigel Topham氏(写真)が明らかにした。
 同氏は組み込みシステムの性能向上に向けた取り組みとして「VLIW(Very Long Instruction Word)」、「スーパースケーラ」、「SMT(Simultaneous Multi Threading)」、「データレベルの並列化」、「プロセッサの並列化」が考えられるとしながらも、「これらのうち3つ(VLIW、スーパースケーラ、SMT)については我々は問題があると考えている」と述べた。それぞれの問題点としてVLIWはコンパイラが複雑になる点、スーパースケーラはハードウエアが複雑になる点、SMTは確かにスループットを向上させるものの、その効果は限られたコア(比較的大きく、かつ非効率的なもの)でしか期待できない点を挙げた。
 そしてデータレベルの並列化における同社のSIMD技術について述べた。ARC750Dコアに向けたこのSIMD拡張命令は、128ビットデータの並列処理が可能。既存のARCompact Instructionアーキテクチャとの互換性がある。ARC750Dコアは、90nmプロセスの場合700MHz動作が可能で、1.526DMIPS/MHz、1068DMIPS/CPUを実現する。
 続いて、SIMD拡張機能をパイプライン実行する場合のフローを示した(図7)。SIMD命令セットは、ARC750Dコア内に格納されている。実行の際には命令がSIMDエクステンション部のコードキューに蓄積され、パイプライン実行される。MPEG-4画像処理の場合、ここでiDCT(逆離散コサイン変換)が繰り返し実行される。その間にARC750Dコア内では画像データのビットストリームに対するエントロピーデコード(重み付けされた符号の復号処理)を実行する。DMA(Direct Memory Access)部ではリファレンスブロック(過去の画像の一部)と最新のデコード結果を元に最新の画像が生成される。
図7 SIMD拡張命令の実行ブロック図

 このSIMD拡張命令を使用すれば、使用していない場合に比べMPEG-4やH.264などのマルチメディアアプリケーションの処理を10倍程度まで加速できるという。
図8 ARC750Dコアを搭載した、サブシステムのフロアプラン

 
 

雑誌無償購読申込み ニュースレター登録 この記事に対する感想/ご意見
Reed Electronics Group
Electronic BUSINESS Japan | Design News Japan | Semiconductor INTERNATIONAL | DETAIL JAPAN
EDN Japanについて | 広告掲載について | サイトマップ | お問合せ
 Copyright (C) 2000-2007 Reed Business Information Japan K.K. 
個人情報に関する方針 | 著作権・リンクについて | 会社情報