Windows

Big Data 3 Vs - 概念とモデルこの記事では、Big Dataのモデルと概念について、Doug Laney、データウェアハウジングのパイオニア。

Class XI # Scalar & Vector # Part - 9# Problem based questions on scalar product of vectors.

Class XI # Scalar & Vector # Part - 9# Problem based questions on scalar product of vectors.

目次:

Anonim

Big Data という言葉が流行っています。用語、負荷、およびデータの負荷から明らかなように、ビッグデータであり、必要な情報を調達するためにさまざまな方法とツールを使用してさまざまな方法で処理できます。この記事では、 Infonomics (情報経済学)の分野を開始したと考えられるデータウェアハウジング分野のパイオニアであるDoug Laney氏が述べたBig Dataの概念について説明します。 >進める前に、本質を把握するためのビッグデータとビッグデータの使用法の基礎に関する記事を読んでみてください。大きなデータの概念の詳細については、この記事に追加することができます。 Big Data 3 Vs

異なる手段で蓄積された巨大なデータは、異なるデータベースに適切に提出され、しばらく後に投棄されました。データが多くなればなるほど、適切なツールを使用してさまざまな関連情報を見つけ出すことが容易になるというコンセプトが登場したとき、企業はデータを長期間保存し始めました。これは、新しいストレージデバイスを追加したり、クラウドを使用してデータが調達されたどのような形式(ドキュメント、スプレッドシート、データベース、HTMLなど)でもデータを保存するようなものです。データ。

注:

ビッグデータの範囲は、建物や敷地内に収集して保存するデータに限定されません。

大量データの3Dモデルは、次のVに基づいています。 ボリューム:データストレージの管理を参照します。

Velocity:データ処理の速度を指す。

  1. Variety:一見無関係な、異なるデータセットのデータをグループ化することを指す。以下のパラグラフは、各次元(各V) A]ビッグデータの量
  2. ビッグデータについて言えば、膨大な量の生の情報としてのボリュームを理解するかもしれません。それは事実ですが、それはまたデータのストレージコストです。重要なデータは、敷地内だけでなく、雲上にも格納できます。後者は柔軟なオプションです。しかし、それぞれをすべて保存する必要がありますか?
  3. Meta Groupがリリースしたホワイトペーパーによれば、データ量が増えるとデータの一部が不要になり始めます。さらに、それは、企業が使用しようとするデータの量だけを保持すべきであると述べている。他のデータが破棄されたり、企業が「重要ではないデータ」を放棄したくない場合は、未使用のコンピュータデバイスやテープにもダンプして、企業がそのようなデータを保存するための費用を支払う必要はありません。 >私は、「重要ではないと思われるデータ」を使用しました。私はあまりにも将来的にどんなタイプのデータも要求することができると信じています。したがって、データが適切であることを知る前に、確かに重要ではありません。個人的には、古いデータを昨年からハードディスクにダンプし、時にはDVDにダンプします。メインコンピュータとクラウドストレージには、私が重要と考えているデータが含まれており、私が使用することを知っています。このデータの中にも、1年に一度の種類のデータがあり、数年後に古いHDDになる可能性があります。上記の例はあなたの理解のためのものです。企業がビッグデータとして認識しているものと比べると、ビッグデータの記述には合わない。

B

]ビッグデータの速度

データ処理の速度は重要な要素であるビッグデータのコンセプトについて話しています。多くのウェブサイト、特に電子商取引があります。グーグルはすでに、ページの読み込み速度が重要であることを認めています。ランキングとは別に、速度はユーザーが買い物をしている間も快適になります。他の情報のために処理されているデータについても同様です。

速度について言えば、それが単なる高い帯域幅を超えていることを知ることが不可欠です。さまざまな分析ツールとすぐに使えるデータを組み合わせています。簡単に使用できるデータとは、処理しやすいデータ構造を作成するための宿題です。次の次元であるバラエティは、このことについてさらに光を広げます。

C>ビッグデータの多様性

データの負荷と負荷がある場合、分析ツールで簡単に処理できるようにデータを整理することが重要になります。データ。データを整理するためのツールもあります。格納するとき、データは構造化されていなくても、どのような形式でも構いません。他のデータとあなたとどのような関係があるのか​​はあなた次第です。 要約

つまり、Big Dataの3Dモデルは、3つの次元、すなわちUSABLEデータに基づいています。あなたが持っていること。データの適切なタグ付け。迅速な処理が可能です。これらの3つが気にされるならば、あなたのデータは、あなたが望むものを理解するために、容易に処理または分析することができます。

上記はビッグデータの両方の概念と3Dモデルを説明しています。

あなたが何かを追加したいのなら、コメントしてください。