Sunday, September 2, 2012

TED: First geographically dispersed database


Imagine a database located on several servers standing, say, London, Warsaw, Moscow, Tokyo and San Francisco. Do not synchronize databases located on different servers, not copies of the same database - a relational database physically located in many places.
Actually, you do not have to imagine yourself as yesterday showed TransLattice TED database, or "TransLattice Elastic Database".
- For the last 15 years trying to solve the problem of distributed databases - TransLattice vice president says Louise Funke. - Our solution is unique (...) it's really a database, the data are in different locations.
The idea behind was founded in 2007, the company was to create a database that would be available at all times, no matter what condition are the excerpts. Database, which would not have a central server and could rebuild the lost fragments of the same data. This hydra, which is scary earthquakes, floods and power failures power. But how is it supposed to work in practice? The data are divided according to three factors. The first is the policy of the institution, who may not want it, that some of the data included in the node located in a particular country. The second factor is the history of access to data - they will be thrown in where most of them use. The third factor is the randomness - the data never will be located on only one node. The data are therefore always on several nodes, but never at all. Currently, TED database can consist of 12 knots, but TransLattice working on this, in the future, increase their number.
The biggest problem, in front of which stood Californian engineers, was to develop algorithms that would provide access to the data of each node, while not occupying the entire bandwidth links only to provide communication and data transfer between the nodes. Internal communication between the nodes of the database could not kill functionality.
- Our system is unique - we monitor the communication between the nodes that have data on the links, and use, so when the system decides to transfer the data, they moved there, where they use them. We can arrange them so as to achieve maximum efficiency - says Funke.
The company ensures that the new node can be started within 20 minutes, and after connecting to the network, other nodes and identify the next few minutes, TED will begin to fill it with data.
The first users today use the TED database. Members of the kind which are not mentioned in public. Funke reveals only that they have "a number of clients from the public sector, related to the defense and intelligence." But not only the interview would be interested in such databases. Large financial institutions and multinational corporations can also benefit from this solution. It seems that three years writing algorithms TransLattice will turn with a vengeance.


ワルシャワ、モスクワ、東京、サンフランシスコ、ロンドン、言う、立っている複数のサーバ上にあるデータベースを想像してみてください。物理的に多くの場所に位置して、リレーショナル·データベース - 別のサーバーではなく、同じデータベースのコピー上にあるデータベースを同期させないでください。
実際には、昨日はTransLattice TEDのデータベース、または "TransLattice弾性データベース"を示したように自分を想像する必要はありません。
- 分散データベースの問題を解決しようと最後の15年間 - TransLattice副社長はルイーズフンケ言う。 - 私たちのソリューションが一意である(...)それは、実際にはデータベースですが、データは、異なる場所にあります。
2007年に設立された背後にある考え方は、会社が抜粋でどのような条件に関係なく、すべての回で使用できなくなるデータベースを作成することでした。中央サーバーを持っていないでしょうし、同じデータの失われた断片を再構築することができるデータベース。恐ろしい地震、洪水、停電電力でこのヒドラ、。しかし、どのようにそれが実際に動作すると思われますが?データは3つの要素に応じて分割されています。第一は、データの一部が特定の国に所在するノードに含まれていること、それをしたくないかもしれない機関の方針である。第二の要因は、データへのアクセスの歴史である - 彼らは、それらのほとんどは、使用する場所でスローされます。第三の要因は、ランダム性です - データは、1つのノード上に配置されませんでした。データは、いくつかのノードで常にそのためですが、決してすべてで。現時点では、TEDのデータベースは12ノットで構成することができますが、これに取り組んでTransLatticeは、将来的には、その数を増やします。
唯一のノード間の通信およびデータ転送を提供するために、全体の帯域幅リンクを占有していないながら、最大の問題は、目の前に、各ノードのデータへのアクセスを提供するアルゴリズムを開発し、カリフォルニアのエンジニアが立っていた。データベース内のノード間の内部通信は機能を殺すことができませんでした。
- 我々のシステムはユニークです - 我々は、彼らがそれらを使用する場所に、システムがデータを転送することを決定したとき、彼らは、そこに移動、リンク上のデータを持っているノード間の通信を監視し、使用しています。最大の能率を発揮し得るように、私たちはそうそれらを手配することができます - フンケは言う。
同社は、新しいノードが20分以内に開始され、ネットワークに接続した後、他のノードと次の数分を識別することができるようになり、TEDは、データとそれを埋めるために開始されます。
最初のユーザが今日のTEDデータベースを使用します。公の場で言及されていない種類のメンバー。フンケは、彼らが持っているだけ明らかにする "防衛と知能に関連した公共部門からのクライアントの数を、"。しかし、インタビューだけでなく、データベースなどに興味があると思います。大手金融機関や多国籍企業にも、このソリューションの恩恵を受けることができます。これは、アルゴリズムTransLatticeを書くのに3年が復讐に回すそうだ。


想象一下,一个站立,说,伦敦,华沙,莫斯科,东京和旧金山的几台服务器上的数据库。不同步的数据库位于不同的服务器上,而不是同一个数据库的副本 - 关系数据库的物理位置,在许多地方。
其实,你不必想象自己昨天公布TransLattice TED数据库,或“TransLattice弹性数据库”。
- 在过去的15年时间试图解决问题的分布式数据库 - TransLattice副总裁路易斯·冯克说。 - 我们的解决方案是独一无二的(...),它是一个真正的数据库,这些数据在不同的位置。
背后的想法是成立于2007年,该公司是创建一个数据库,将可在任何时候,不管是什么条件的摘录。数据库,它不会有一个中央服务器可以重建丢失的相同的数据片段。这九头蛇,这是可怕的地震,洪水和停电的功率。但它是如何在实际工作中应该吗?数据被分为根据三个因素。首先是政策的机构,谁不希望它的一些数据中包含的节点在一个特定的国家。第二个因素是数据访问的历史 - 它们将被扔在那里他们大多使用。第三个因素是随机性 - 绝不会只在一个节点上的数据。的数据,因此总是在几个节点上,但从来没有在所有。目前,TED数据库可以由12节,但TransLattice这方面的工作,在未来,增加其数量。
最大的问题,站在前面,其中加利福尼亚州的工程师,开发新的算法,将提供每个节点的数据访问,同时不占用整个带宽链接仅仅在于提供节点之间的通信和数据传输。不能杀死的数据库节点之间的内部通信功能。
- 我们的系统是独特的 - 我们监测的链接有数据的节点之间的通信,并使用,因此决定将数据传输系统时,他们搬到那里,在那里他们用他们。我们可以安排他们,以达到最高的效率 - 冯克说。
公司确保在20分钟内可以开始新的节点,并连接到网络后,其他节点,并确定接下来的几分钟后,TED将开始用数据填充它。
今天的第一个用户使用的TED的数据库。有没有在公开场合提及的那种。冯克可以看出:只有他们有“一些客户来自公共部门,国防和情报。”但在这样的数据库不仅会感兴趣面试。大型金融机构和跨国公司也可以从该解决方案中受益。看来,三年写算法TransLattice将打开与报复。


No comments:

Post a Comment