2つの言語に共通の埋め込みを作成する -- deep-learning フィールド と nlp フィールド と pytorch フィールド と multilingual フィールド と embedding フィールド 関連 問題

creating a common embedding for two languages












0
vote

問題

日本語

私の仕事は多言語のような(英語とヒンディー語)を扱います。そのために私は両方の言語を表すために一般的な埋め込みが必要です。

私は「MUSE」のような多言語埋め込みを学ぶための方法があることを知っていますが、これは一般的なベクトル空間にある2つの埋め込みを表します。明らかにそれらは似ていますが、同じではありません。

だから私は両方の言語を表す単一の埋め込みの形式で埋め込むことを学ぶことができる方法やアプローチがあるかどうか知りたかった。

任意の鉛は強く感謝されています!!!

英語

My task deals with multi-language like (english and hindi). For that I need a common embedding to represent both languages.

I know there are methods for learning multilingual embedding like 'MUSE', but this represents those two embeddings in a common vector space, obviously they are similar, but not the same.

So I wanted to know if there is any method or approach that can learn to represent both embedding in form of a single embedding that represents the both the language.

Any lead is strongly appreciated!!!

</div
              

回答リスト

2
 
vote

私は良い鉛が現場で行われた過去の仕事を見ることになると思います。 Sebastian RuderのTalk 、それはあなたに与えるあなたがあなたの出所/ターゲット言語について持っている情報のレベルに応じて、多数のアプローチ。これは基本的にMuseが何をしているのか、そして私はそれが最先端のものと見なされることを比較的確信しています。

ほとんどのアプローチの基本的な考え方は、両方の間の(通常はユークリッド)距離を最小にするように埋め込みスペースをマッピングすることです(リンクの16を参照)。これは、既知の辞書がある場合は明らかに機能し、異なる翻訳を正確にマッピングでき、2つの言語が同様の言語プロパティ(ヒンディー語と英語については確かではない)を正確にマッピングできます(正直になるように確信していない)。

もう1つの最近のアプローチは、多言語 - Bert(Mbert) 、または同様に、 XLM-Roberta 。しかし、これらは共有語彙に基づいて埋め込みを学びます。形態学的に異なる言語がある場合、これはまた望ましくなく、他の無関係な言語の束を組み込んでいるという欠点を持っているかもしれません。

それ以外の場合は、「一般的な埋め込み」から期待しているのが正確に何をしていませんが、一度明確にされた答えを拡張できて幸せです。

 

I think a good lead would be to look at past work that has been done in the field. A good overview to start with is Sebastian Ruder's talk, which gives you a multitude of approaches, depending on the level of information you have about your source/target language. This is basically what MUSE is doing, and I'm relatively sure that it is considered state-of-the-art.

The basic idea in most approaches is to map embedding spaces such that you minimize some (usually Euclidean) distance between the both (see p. 16 of the link). This obviously works best if you have a known dictionary and can precisely map the different translations, and works even better if the two languages have similar linguistic properties (not so sure about Hindi and English, to be honest).

Another recent approach is the one by Multilingual-BERT (mBERT), or similarly, XLM-RoBERTa, but those learn embeddings based on a shared vocabulary. This might again be less desirable if you have morphologically dissimilar languages, and also has the drawback that they incorporate a bunch of other, unrelated, languages.

Otherwise, I'm unclear on what exactly you are expecting from a "common embedding", but happy to extend the answer once clarified.

</div
 
 
 
 

関連する質問

1  Windows Media Player用のJPGをプレビューします  ( Preview jpg for a windows media player ) 
私の単純な.wmvプレーヤーのためのJPGプレビューをしたいのですが。何か案は?ここでは... です <事前> <コード> <div id="embed"> <OBJECT id='mediaPlayer1' width="360" height="240" ...

226  ダウンロード(PDF)の代わりにブラウザでファイルを開くにはどうすればいいですか?  ( How do i force files to open in the browser instead of downloading pdf ) 
ブラウザの「PDFを表示する」オプションがチェックされていない場合は、PDFファイルをブラウザで開く方法がありますか? 埋め込みタグとIFrameを使用してみましたが、そのオプションがチェックされている場合にのみ機能します。 私は何ができますか? ...

3  既存のIOS / Androidネイティブアプリケーションへのキビを埋め込む  ( Embedding kivy into existing ios android native applications ) 
私は既存のネイティブIOSとAndroidアプリ(それぞれSWIFTとKotlin)を持っています。 私はまた、既存のスタンドアロンのクロスプラットフォームのキビアプリを持っています。 Kivyアプリをネイティブアプリに埋め込む方法があるかどうかを知りたいの...

2  NET WinForms展開  ( Net winforms deployment ) 
は、すべてのリソースをapp.configや関連するDLLのような単一のEXEファイルに組み合わせるためのものですか? emuleなどのアプリケーションのようなものがあるようです。 私は私のapp.configが座って編集するのを待っていません。 ありがとう...

31  プログラムでJava H2データベースを埋め込む  ( Embedding the java h2 database programmatically ) 
hsqldb を組み込みデータベースとして使用しますが、メモリのないデータベースを検索します。データ量が増加するにつれて。 > Derby / javadb は、システムプロパティでプロパティをグローバルに保存するため、現時点ではオプションではありません...

2  Rawr JarにJARライブラリを含めます  ( Include jar libraries in rawr jar ) 
rawr を使用してJRubyからJARを作成し、Javaライブラリがカップルがあります(私が使いたいjar形式)。これはうまく機能しますが、パッケージのディレクトリに結果のパッケージとの両方に含むフォルダのコピーを置きます。私がそれを実行するとき、それは...

0  StellarGraphは、加重指向グラフからノードの埋め込みを生成する  ( Stellargraph generate nodes embeddings from a weighted directed graph ) 
私は次のようなPandasデータフレームを持っています: <事前> <コード> source target weight src_attr_1 src_attr_2 target_attr_1 target_attr_2 i...

0  YouTubeビデオを埋め込むことはもうMavericksでは動作しません  ( Embedding youtube video doesnt work anymore in mavericks ) 
OSX 10.6および新しいバージョンのための私のCocoaアプリでは、常にこのコードを使用してYouTubeからビデオを埋め込む: <事前> <コード> NSString *html = @"<center><iframe width="748" heig...

1  入力としてContenteditable属性を使用してHTMLコンテンツを表示します  ( Display html content with contenteditable attribute as input ) 
HTMLエディタとしてContenteditable属性を使用することは可能ですか?たとえば、youtube埋め込みコードをContenteditable属性でDIVに貼り付けるために、そしてすぐにビデオを見ることができるように。 <事前> <コード> ps...

5  ケラス層連結  ( Keras layer concatenation ) 
複数の埋め込みレイヤやその他の入力を含むKerasでモデルを作成できる方法を確認しています。私のモデルがどのように構造化されているか(E =埋め込み層、....] =入力層): <事前> <コード> E E [V V V] | / | / ...




© 2022 cndgn.com All Rights Reserved. Q&Aハウス 全著作権所有