2011
論文誌
Junichi OHMURA; Takefumi MIYOSHI; Hidetsugu IRIE; Tsutomu YOSHINAGA Computation-Communication Overlap of Linpack on a GPU-Accelerated PC Cluster Journal Article In: IEICE TRANSACTIONS on Information and Systems, E94-D (12), pp. 2319-2327, 2011. @article{IEICEOhmura11, title = {Computation-Communication Overlap of Linpack on a GPU-Accelerated PC Cluster}, author = {Junichi OHMURA and Takefumi MIYOSHI and Hidetsugu IRIE and Tsutomu YOSHINAGA}, url = {http://search.ieice.org/bin/summary.php?id=e94-d_12_2319&category=D&year=2011&lang=E&abst=}, year = {2011}, date = {2011-12-01}, journal = {IEICE TRANSACTIONS on Information and Systems}, volume = {E94-D}, number = {12}, pages = {2319-2327}, keywords = {}, pubstate = {published}, tppubtype = {article} } |
国際会議
口頭発表
Hidetsugu IRIE, Takefumi MIYOSHI, Goki HONJO, Kei HIRAKI, Tsutomu YOSHINAGA CCCPO: Robust Prefetcher Optimization Technique Based on Cache Convection Incollection In: International Conference on Networking and Computing (ICNC'11), pp. 127-133, 2011, ISBN: 978-1-4577-1796-3. @incollection{IRIE2011, title = {CCCPO: Robust Prefetcher Optimization Technique Based on Cache Convection}, author = {Hidetsugu IRIE, Takefumi MIYOSHI, Goki HONJO, Kei HIRAKI, Tsutomu YOSHINAGA}, url = {http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6131826}, isbn = {978-1-4577-1796-3}, year = {2011}, date = {2011-12-02}, booktitle = {International Conference on Networking and Computing (ICNC'11)}, pages = {127-133}, abstract = {One of the significant issues of processor architecture is to overcome memory latency. Prefetching can greatly improve cache performance, however, it has the drawback of cache pollution unless its aggressiveness is properly set. Although several techniques for prefetcher throttling have been proposed which use accuracy as a metric, their robustness were not sufficient due to the variations between program working set sizes and cache capacities. In this paper, we revisit cache behavior with the viewpoint of data lifetime in a cache with prefetching. Based on this observation Cache-Convection-Control-based Prefetch Optimization (CCCPO) is proposed, which exploits the characteristics of cache line reuse and controls the prefetcher aggressiveness. Evaluation results showed that this novel approach achieved 4.6% improvement against the most recent prefetcher throttling algorithms in the geometric mean of SPEC CPU 2006 benchmark suite with 256KB LLC.}, keywords = {}, pubstate = {published}, tppubtype = {incollection} } One of the significant issues of processor architecture is to overcome memory latency. Prefetching can greatly improve cache performance, however, it has the drawback of cache pollution unless its aggressiveness is properly set. Although several techniques for prefetcher throttling have been proposed which use accuracy as a metric, their robustness were not sufficient due to the variations between program working set sizes and cache capacities. In this paper, we revisit cache behavior with the viewpoint of data lifetime in a cache with prefetching. Based on this observation Cache-Convection-Control-based Prefetch Optimization (CCCPO) is proposed, which exploits the characteristics of cache line reuse and controls the prefetcher aggressiveness. Evaluation results showed that this novel approach achieved 4.6% improvement against the most recent prefetcher throttling algorithms in the geometric mean of SPEC CPU 2006 benchmark suite with 256KB LLC. |
Junichi Ohmura, Akira Egashira, Shunji Satoh, Takefumi Miyoshi,Hidetsugu Irie,; Tsutomu Yoshinaga Multi-GPU Acceleration of Optical Flow Computation in Visual Functional Simulation Inproceedings In: Networking and Computing (ICNC), 2011 Second International Conference on, pp. pp.228-234, 2011, ISBN: 978-1-4577-1796-3. @inproceedings{Ohmura2011, title = {Multi-GPU Acceleration of Optical Flow Computation in Visual Functional Simulation}, author = {Junichi Ohmura, Akira Egashira, Shunji Satoh, Takefumi Miyoshi,Hidetsugu Irie, and Tsutomu Yoshinaga}, url = {http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6131811&tag=1}, isbn = {978-1-4577-1796-3}, year = {2011}, date = {2011-12-02}, booktitle = {Networking and Computing (ICNC), 2011 Second International Conference on}, journal = {Networking and Computing (ICNC), 2011 Second International Conference on}, pages = {pp.228-234}, abstract = {Numerical simulation for visual processing of the human brain is one of time-consuming applications. This paper shows acceleration techniques for a simulation program of the visual processing. We parallelize convolution calculations, which are core operations, which the simulation program requests, on a GPU-accelerated PC cluster. Our implementation includes three improvement points. Firstly, we consider efficient data mapping onto global and shared memories1 of the GPU. Secondly, multiple convolutions for the same input data are computed by each node\'s GPU, referred to as package execution. Finally, an input 2-dimensional image is divided into regions and convolutions for these regions are executed in parallel utilizing MPI (Message Passing Interface). Our experimental results show a linear speedup up to 12 nodes in the PC cluster for the convolution program. We also show the effects of the package execution and reduced communication on NVIDIA tesla C1060 and C2070, respectively.}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } Numerical simulation for visual processing of the human brain is one of time-consuming applications. This paper shows acceleration techniques for a simulation program of the visual processing. We parallelize convolution calculations, which are core operations, which the simulation program requests, on a GPU-accelerated PC cluster. Our implementation includes three improvement points. Firstly, we consider efficient data mapping onto global and shared memories1 of the GPU. Secondly, multiple convolutions for the same input data are computed by each node's GPU, referred to as package execution. Finally, an input 2-dimensional image is divided into regions and convolutions for these regions are executed in parallel utilizing MPI (Message Passing Interface). Our experimental results show a linear speedup up to 12 nodes in the PC cluster for the convolution program. We also show the effects of the package execution and reduced communication on NVIDIA tesla C1060 and C2070, respectively. |
Yasin Oge; Takefumi Miyoshi; Hideyuki Kawashima; Tsutomu Yoshinaga An Implementation of Handshake Join on FPGA Inproceedings In: 2011 Second International Conference on Networking and Computing, pp. 95-104, 2011. @inproceedings{ICNC11Oge, title = {An Implementation of Handshake Join on FPGA}, author = {Yasin Oge and Takefumi Miyoshi and Hideyuki Kawashima and Tsutomu Yoshinaga}, url = {http://ir.lib.uec.ac.jp/infolib/user_contents/9090000046/9090000046.pdf}, year = {2011}, date = {2011-11-30}, booktitle = {2011 Second International Conference on Networking and Computing}, pages = {95-104}, abstract = {This paper shows an implementation of handshake join on field-programmable gate array (FPGA). Handshake join is one of stream join algorithms, proposed by Teubner and Mueller. It can support very high degrees of parallelism and attain unprecedented success in throughput speed in order to achieve efficient support for window-based join in streaming databases. In handshake join, it is necessary to take into account the problems with regard to the capacity of the output channel and the limitation of the internal buffer sizes, in order to apply join operation to input tuples efficiently in a correct manner. However, the implementation has not necessarily clarified in detail yet in their paper. In this paper, to solve the issues, we propose the merging network and the admission controller. Then we evaluate the architecture in terms of the hardware resource usage, the maximum clock frequency, and the operation performance.}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } This paper shows an implementation of handshake join on field-programmable gate array (FPGA). Handshake join is one of stream join algorithms, proposed by Teubner and Mueller. It can support very high degrees of parallelism and attain unprecedented success in throughput speed in order to achieve efficient support for window-based join in streaming databases. In handshake join, it is necessary to take into account the problems with regard to the capacity of the output channel and the limitation of the internal buffer sizes, in order to apply join operation to input tuples efficiently in a correct manner. However, the implementation has not necessarily clarified in detail yet in their paper. In this paper, to solve the issues, we propose the merging network and the admission controller. Then we evaluate the architecture in terms of the hardware resource usage, the maximum clock frequency, and the operation performance. |
ポスター発表
Sorry, no publications matched your criteria.
研究会
清水 裕基,三好 健文,入江 英嗣,吉永 努 TCPセッションへの識別子付与による複数プロセス横断可能な処理追跡法 Journal Article In: 第23回 コンピュータシステム・シンポジウム (ComSys 2011) 論文集, pp. 105-114, 2011. @article{努2011, title = {TCPセッションへの識別子付与による複数プロセス横断可能な処理追跡法}, author = {清水 裕基,三好 健文,入江 英嗣,吉永 努}, year = {2011}, date = {2011-12-01}, journal = {第23回 コンピュータシステム・シンポジウム (ComSys 2011) 論文集}, pages = {105-114}, keywords = {}, pubstate = {published}, tppubtype = {article} } |
放地 宏佳,三好 健文,入江 英嗣,吉永 努 ネットワークコンピューティングのための包括的マッシュアップフレームワークの検討 Journal Article In: 情報処理学会研究報告, 2011-UBI-32 (11), pp. 1-8, 2011, ISSN: 09196072. @article{努2011b, title = {ネットワークコンピューティングのための包括的マッシュアップフレームワークの検討}, author = {放地 宏佳,三好 健文,入江 英嗣,吉永 努}, url = {http://ci.nii.ac.jp/naid/110008682496}, issn = {09196072}, year = {2011}, date = {2011-11-24}, journal = {情報処理学会研究報告}, volume = {2011-UBI-32}, number = {11}, pages = {1-8}, abstract = {スマートフォンや情報家電といったネットワーク接続可能なデバイスにより実世界の多種多様な場面で情報処理を活用できるようになった.それに伴って,多種多様な用途を対象としたアプリケーションが求められるようになっている.そこで,多様化するアプリケーションをユーザ自身が開発できるよう,プログラミングに慣れていないユーザであっても,自らのアプリケーションへの要求を自らで満たすことが可能なマッシュアップフレームワーク IDUMO を提案する.IDUMO フレームワークでは,マッシュアップに必要不可欠な機能である,(1) 統一的な入出力インタフェースの定義,(2) プログラム実行モデルの差異の吸収,(3) 容易な開発方法,を提供する.本論文では,IDUMO フレームワークの設計について述べ,アプリケーション開発のケーススタディにより有用性を示す.}, keywords = {}, pubstate = {published}, tppubtype = {article} } スマートフォンや情報家電といったネットワーク接続可能なデバイスにより実世界の多種多様な場面で情報処理を活用できるようになった.それに伴って,多種多様な用途を対象としたアプリケーションが求められるようになっている.そこで,多様化するアプリケーションをユーザ自身が開発できるよう,プログラミングに慣れていないユーザであっても,自らのアプリケーションへの要求を自らで満たすことが可能なマッシュアップフレームワーク IDUMO を提案する.IDUMO フレームワークでは,マッシュアップに必要不可欠な機能である,(1) 統一的な入出力インタフェースの定義,(2) プログラム実行モデルの差異の吸収,(3) 容易な開発方法,を提供する.本論文では,IDUMO フレームワークの設計について述べ,アプリケーション開発のケーススタディにより有用性を示す. |
放地 宏佳,三好 健文,入江 英嗣,吉永 努 「覗き込み」を利用した直感的な外部ディスプレイアクセス方式の提案 Journal Article In: 情報処理学会研究報告, 2011-UBI-32 (12), pp. 1-8, 2011, ISSN: 09196072. @article{努2011b, title = {「覗き込み」を利用した直感的な外部ディスプレイアクセス方式の提案}, author = {放地 宏佳,三好 健文,入江 英嗣,吉永 努}, url = {http://ci.nii.ac.jp/naid/110008682497}, issn = {09196072}, year = {2011}, date = {2011-11-24}, journal = {情報処理学会研究報告}, volume = {2011-UBI-32}, number = {12}, pages = {1-8}, abstract = {本論文では,携帯端末とディスプレイ端末を連携するため,「覗き込む」 ことによって携帯端末からディスプレイ端末に無線環境でアクセスするシステム UDU を提案する.携帯端末とディスプレイ端末を連携するためには,簡単に携帯端末とディスプレイ端末を接続できることが必要である.また,携帯端末が不特定多数が使う公共のディスプレイ端末と連携する場合でも,安全に通信できる必要がある.そこで,UDU では通信したいディスプレイ端末に表示した識別子を携帯端末のカメラで読み込むことにより,簡単かつセキュアに携帯端末とディスプレイ端末の連携を実現する.本システムの初期実装では,ディスプレイ端末を携帯端末のカメラで 「覗き込む」 だけで,簡単にディスプレイ端末との通信が確立できた.}, keywords = {}, pubstate = {published}, tppubtype = {article} } 本論文では,携帯端末とディスプレイ端末を連携するため,「覗き込む」 ことによって携帯端末からディスプレイ端末に無線環境でアクセスするシステム UDU を提案する.携帯端末とディスプレイ端末を連携するためには,簡単に携帯端末とディスプレイ端末を接続できることが必要である.また,携帯端末が不特定多数が使う公共のディスプレイ端末と連携する場合でも,安全に通信できる必要がある.そこで,UDU では通信したいディスプレイ端末に表示した識別子を携帯端末のカメラで読み込むことにより,簡単かつセキュアに携帯端末とディスプレイ端末の連携を実現する.本システムの初期実装では,ディスプレイ端末を携帯端末のカメラで 「覗き込む」 だけで,簡単にディスプレイ端末との通信が確立できた. |
樫原 裕大,清水 裕基,三好 健文,吉永 努,入江 英嗣 スマートフォンを用いた歩行動作改善ツールの開発 Journal Article In: 情報処理学会研究報告, 2011-UBI-32 (7), pp. 1-8, 2011, ISSN: 09196072. @article{英嗣2011, title = {スマートフォンを用いた歩行動作改善ツールの開発}, author = {樫原 裕大,清水 裕基,三好 健文,吉永 努,入江 英嗣}, url = {http://ci.nii.ac.jp/naid/110008682492}, issn = {09196072}, year = {2011}, date = {2011-11-24}, journal = {情報処理学会研究報告}, volume = {2011-UBI-32}, number = {7}, pages = {1-8}, abstract = {日常で歩行は何気なく行われている.しかし,何も考えずにに歩いていると知らない内に悪い癖がつき,身体に様々な問題が起こる可能性がある.これらの問題は姿勢を意識することで予防・改善することができる.そこで本稿では,スマートフォンに内蔵されている加速度センサを用いて歩行分析を行うことで,歩行時に良い姿勢を意識させるアプリケーションを検討・開発した.これにより,歩行中に悪い姿勢であったときに警報音が鳴り,常に正しい姿勢を使用者に意識させることが可能となった.}, keywords = {}, pubstate = {published}, tppubtype = {article} } 日常で歩行は何気なく行われている.しかし,何も考えずにに歩いていると知らない内に悪い癖がつき,身体に様々な問題が起こる可能性がある.これらの問題は姿勢を意識することで予防・改善することができる.そこで本稿では,スマートフォンに内蔵されている加速度センサを用いて歩行分析を行うことで,歩行時に良い姿勢を意識させるアプリケーションを検討・開発した.これにより,歩行中に悪い姿勢であったときに警報音が鳴り,常に正しい姿勢を使用者に意識させることが可能となった. |
小貫 貴央; 神田 尚子; 放地 宏佳; 吉永 努; 入江 英嗣 関連データ先読みとスマートフォンの消費電力に関する研究 Inproceedings In: 第10回情報科学技術フォーラム, 2011. @inproceedings{onukifit2011, title = {関連データ先読みとスマートフォンの消費電力に関する研究}, author = {小貫 貴央 and 神田 尚子 and 放地 宏佳 and 吉永 努 and 入江 英嗣}, year = {2011}, date = {2011-09-09}, booktitle = {第10回情報科学技術フォーラム}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } |
Takefumi Miyoshi; Hideyuki Kawashima; Yuta Terada; Tsutomu Yoshinaga A Coarse Grain Reconfigurable Processor Architecture for Stream Processing Engine Inproceedings In: 21st International Conference on Field Programmable Logic and Applications, Chania, Crete, 2011. @inproceedings{miyoshifpl2011, title = {A Coarse Grain Reconfigurable Processor Architecture for Stream Processing Engine}, author = {Takefumi Miyoshi and Hideyuki Kawashima and Yuta Terada and Tsutomu Yoshinaga}, year = {2011}, date = {2011-09-05}, booktitle = {21st International Conference on Field Programmable Logic and Applications, Chania, Crete}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } |
島 圭吾; 三好 健文; 近藤 正章; 入江 英嗣; 本多 弘樹; 吉永 努 MPI埋め込み可能GPUプログラミングフレームワーク適用可能性の評価 Inproceedings In: 並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ, 2011. @inproceedings{shimaswopp2011, title = {MPI埋め込み可能GPUプログラミングフレームワーク適用可能性の評価}, author = {島 圭吾 and 三好 健文 and 近藤 正章 and 入江 英嗣 and 本多 弘樹 and 吉永 努}, year = {2011}, date = {2011-07-29}, booktitle = {並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ}, abstract = {GPU同士のデータ授受を見通しよく記述できるようにするために,MPIを埋め込み可能なGPUプログラミングフレームワークが提案された.埋め込まれたMPI処理は,コンパイル時にCPUへのMPI処理の要求に変換され,実行時にCPU上のランタイムルーチンによって適切に処理される.本稿では,このプログラミングフレームワークの適用可能性について,Livermoreループから選んだ3つのプログラムとライフゲームを用いて,これらの実行時間と正しく動作するように容易に記述できるかの観点で評価をした.}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } GPU同士のデータ授受を見通しよく記述できるようにするために,MPIを埋め込み可能なGPUプログラミングフレームワークが提案された.埋め込まれたMPI処理は,コンパイル時にCPUへのMPI処理の要求に変換され,実行時にCPU上のランタイムルーチンによって適切に処理される.本稿では,このプログラミングフレームワークの適用可能性について,Livermoreループから選んだ3つのプログラムとライフゲームを用いて,これらの実行時間と正しく動作するように容易に記述できるかの観点で評価をした. |
大村 純一; 佐藤 俊治; 三好 健文; 入江 英嗣; 吉永 努 視覚神経系モデルシミュレーションの複数GPUによる高速化 Inproceedings In: 2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ, 2011. @inproceedings{oomuraswopp2011, title = {視覚神経系モデルシミュレーションの複数GPUによる高速化}, author = {大村 純一 and 佐藤 俊治 and 三好 健文 and 入江 英嗣 and 吉永 努}, year = {2011}, date = {2011-07-27}, booktitle = {2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ}, journal = {2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ}, abstract = {人間の視覚系の 「機能」 を細胞の入出力関係だけに着目して線形モデルで表し,計算機でシミュレーションを行う手法が広く用いられている.しかし膨大な細胞数のシミュレーションには時間がかかるため,モデルを簡略化し,再現すべき視覚機能を限定したシミュレーションが行われることが多い.そこで,本研究ではシミュレーションを高速化するために,プログラムを並列化し,GPU を搭載した PC クラスタを用いて実行する.本稿では,シミュレーションで必要となる演算を,NVIDIA C1060 と C2070 の異なるアーキテクチャの GPU で実行したときの性能の違いについて示す.また,C1060 を搭載した PC クラスタ上での並列実行により,16 台の GPU を用いたシミュレーションにおいて高い並列化効率が実現できたことを示す.}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } 人間の視覚系の 「機能」 を細胞の入出力関係だけに着目して線形モデルで表し,計算機でシミュレーションを行う手法が広く用いられている.しかし膨大な細胞数のシミュレーションには時間がかかるため,モデルを簡略化し,再現すべき視覚機能を限定したシミュレーションが行われることが多い.そこで,本研究ではシミュレーションを高速化するために,プログラムを並列化し,GPU を搭載した PC クラスタを用いて実行する.本稿では,シミュレーションで必要となる演算を,NVIDIA C1060 と C2070 の異なるアーキテクチャの GPU で実行したときの性能の違いについて示す.また,C1060 を搭載した PC クラスタ上での並列実行により,16 台の GPU を用いたシミュレーションにおいて高い並列化効率が実現できたことを示す. |
三好 健文; 近藤 正章; 入江 英嗣; 吉永 努; 本多 弘樹 MPIを埋め込み可能なGPUプログラミングフレームワークの検討 Inproceedings In: 先進的計算基盤システムシンポジウム SACSIS 2011, 2011. @inproceedings{miyoshisacsis, title = {MPIを埋め込み可能なGPUプログラミングフレームワークの検討}, author = {三好 健文 and 近藤 正章 and 入江 英嗣 and 吉永 努 and 本多 弘樹}, year = {2011}, date = {2011-05-27}, booktitle = { 先進的計算基盤システムシンポジウム SACSIS 2011}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } |
齋藤 祐典; 佐藤 俊治; 大村 純一; 三好 健文; 入江 英嗣; 吉永 努 視覚神経系数理モデルシミュレーションのMPI による並列化 Inproceedings In: 第129回ハイパフォーマンスコンピューティング研究発表会, 2011. @inproceedings{saitouipsj2011, title = {視覚神経系数理モデルシミュレーションのMPI による並列化}, author = {齋藤 祐典 and 佐藤 俊治 and 大村 純一 and 三好 健文 and 入江 英嗣 and 吉永 努}, year = {2011}, date = {2011-05-10}, booktitle = {第129回ハイパフォーマンスコンピューティング研究発表会}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } |
松村 雄貴; 三好 健文; 吉永 努; 入江英嗣 3次元積層向けブロック配置問題の検討 Inproceedings In: 情報処理学会研究報告, 2011. @inproceedings{matsumuraipsj2011, title = {3次元積層向けブロック配置問題の検討}, author = {松村 雄貴 and 三好 健文 and 吉永 努 and 入江英嗣}, year = {2011}, date = {2011-04-06}, booktitle = {情報処理学会研究報告}, volume = {2011-ARC-187}, number = {10}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } |
寺西 良太; 三好 健文; 入江 英嗣; 吉永 努 クラウドによる携行可能な指先での 署名認証システムの開発 Inproceedings In: 情報処理学会研究報告, pp. 1 – 8, 2011. @inproceedings{teranishiipsj2011, title = {クラウドによる携行可能な指先での 署名認証システムの開発}, author = {寺西 良太 and 三好 健文 and 入江 英嗣 and 吉永 努}, year = {2011}, date = {2011-03-07}, booktitle = {情報処理学会研究報告}, volume = {2011-UBI-29}, number = {8}, pages = {1 -- 8}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } |
寺田 祐太; 三好 健文; 川島 英之; 吉永 努 FPGAを用いたデータストリームに対するウィンドウジョインの検討 Inproceedings In: 信学技報, pp. 181 – 186, 2011. @inproceedings{teradaieice2011, title = {FPGAを用いたデータストリームに対するウィンドウジョインの検討}, author = {寺田 祐太 and 三好 健文 and 川島 英之 and 吉永 努}, year = {2011}, date = {2011-01-18}, booktitle = {信学技報}, journal = {信学技報}, volume = {110}, number = {362}, pages = {181 -- 186}, abstract = {データストリーム処理の演算の一つであるウ ィ ンドウジ ョインをFPGAを用いて高速化す る手法を検討する.データストリーム処理では,データ を取り零すことな く処理する必要があり,計算機への演算負荷は大きい.FPGAによる専用ハードウェア化は,高い演算能力を提供する手段として有力な選択肢である.FPGAで高速化を達成するためには並列性の活用が重要であるが,ウィ ンドウジ ョインは本来逐次的な処理である.そこで,FPGA 上で高速に処理するために並列化手法の初期検討を行う.また,さらなる高速化につい ての課題を議論す る . }, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } データストリーム処理の演算の一つであるウ ィ ンドウジ ョインをFPGAを用いて高速化す る手法を検討する.データストリーム処理では,データ を取り零すことな く処理する必要があり,計算機への演算負荷は大きい.FPGAによる専用ハードウェア化は,高い演算能力を提供する手段として有力な選択肢である.FPGAで高速化を達成するためには並列性の活用が重要であるが,ウィ ンドウジ ョインは本来逐次的な処理である.そこで,FPGA 上で高速に処理するために並列化手法の初期検討を行う.また,さらなる高速化につい ての課題を議論す る . |
三好 健文; 寺田 祐太; 川島 英之; 吉永 努 動的再構成可能データベース処理エンジンとクエリコンパイラの検討 Inproceedings In: 動的再構成可能データベース処理エンジンとクエリコンパイラの検討, pp. 161 – 171, 2011. @inproceedings{miyoshiipsj2011, title = {動的再構成可能データベース処理エンジンとクエリコンパイラの検討}, author = {三好 健文 and 寺田 祐太 and 川島 英之 and 吉永 努}, year = {2011}, date = {2011-01-09}, booktitle = {動的再構成可能データベース処理エンジンとクエリコンパイラの検討}, pages = {161 -- 171}, keywords = {}, pubstate = {published}, tppubtype = {inproceedings} } |