データ仮想化
新しい分析上の問いが生じるたびに、新たなETLジョブ、新たなウェアハウステーブル、そして鮮度の所有者をめぐる新たな議論が必要になるように見えます。3forgeは、ビジネスユーザーやアナリストが単一のガバナンスされたインターフェースからリアルタイムストリームと静的データベースを横断して照会できるようにし、余分なコピーも、夜間ロードも、古くなっていく別個のセマンティックレイヤーも不要にします。
課題
あらゆる問いがデータのもう1つのコピーを求める
ソースを組み合わせる唯一の方法がまずウェアハウスへ取り込むことである場合、新しい分析の問いが生じるたびに、もう1つのコピー、もう1つのETL、もう1つの鮮度契約、そして交渉すべきもう1つのチームが生まれます。リアルタイムストリームはほとんど取り込まれないため、ライブデータに触れるあらゆる問いは結局、昨日のプロジェクションに対して実行されることになります。
ウェアハウスはライブに追いつけない
ストリームをウェアハウスへロードするのは、役立つには遅すぎるか、スケールさせるには高価すぎるかのいずれかです。リアルタイムの問いを投げるアナリストは、まだデータを持っていないレイヤーに当たります。
コピーが増殖し、ガバナンスが損なわれる
下流の各コピーは、セキュア化、マスキング、監査を行わなければならない新たな場所です。同じデータセットを3つのチームへ提供することは、四半期ごとのコンプライアンス作業になってしまいます。
ソースごとに異なるクエリ言語
KafkaとOracleとベンダーAPIを結合するには、アナリストは3つのツールを習得し、回答をスプレッドシートで継ぎ合わせざるを得ません。価値はクロスソースのビューにありますが、その摩擦が価値を台無しにします。
セルフサービスがITに阻まれる
小さなクロスソースのデータセットを求めるビジネスユーザーは、チケットを起票し、ETLの変更を待ち、その遅延を受け入れなければなりません。半日で済むはずの作業が6週間かかります。
3forgeのアプローチ
ストリームとストアにまたがる1つのクエリ面
3forgeは、接続されたすべてのソース、メッセージングトピック、リレーショナルデータベース、ベンダーAPI、ファイル、内部サービスを、統一的に照会可能なデータモデルとして提示します。ビジネスユーザーはソースを横断して結合するSQLライクなクエリを発行し、Data Gatewayが述語を各システムへプッシュダウンして結果をインメモリで結合します。ライブデータと静的データは同じ回答セットで返され、同じアクセスポリシーによってガバナンスされ、物理的なコピーも別個のセマンティックレイヤーもありません。
主な機能
3forgeで実現できること
ソース横断のフェデレーテッドクエリ
メッセージングストリーム、リレーショナルデータベース、ベンダーAPI、ファイルを単一のSQLライクなクエリで結合し、接続された各システムへ述語をプッシュダウンします。
ライブと静的を1つの結果に
ストリーミングデータと静的データを同じ回答セットで組み合わせ、鮮度と一貫性の境界を明示的に扱います。
物理コピー不要
データをウェアハウスへ複製することを避けます。信頼できるレコードは記録システムにとどまり、その所有者によってガバナンスされ続けます。
ガバナンスされたアクセス
仮想化レイヤーで行レベル、列レベル、エンタイトルメントベースの制御を適用し、同じクエリがポリシーに応じてユーザーごとに異なる結果を返すようにします。
アナリストのセルフサービス
ビジネスアナリストがチケットを起票することなくワークベンチからクロスソースのクエリを組み立てられ、結果はすべてのガバナンスルールを尊重します。
選択的マテリアライゼーション
レイテンシが重要な場合はホットなサブクエリをカラムストアにキャッシュし、残りは仮想のままにして、キャッシュの鮮度をクエリごとに制御します。
お問い合わせ
ライブでご覧になりますか?
3forgeのソリューションエンジニアによる30分間のデモを予約し、代表的なソースの組み合わせに対してフェデレーテッドクエリを実行してみてください。