2013-01-01から1年間の記事一覧

Social Text Normalization using Contextual Graph Random Walks

ACL2013Hany Hassan, Arul Menezes Microsoft ResearchOOVのNormalization 昨年、ちらほらRandom Walkが熱いと聞いていたので、さっそくチェック。 OOVを正規化する上で 1. 辞書に含まれていない多くの単語やNEは正規化するべきではない。 2. 同じOOVでも文…

AlchemyAPIのSentiment精度をSentiment140のデータで評価する

AlchemyAPI http://www.alchemyapi.com/Techchrunchでも紹介されていた。 http://jp.techcrunch.com/2013/02/09/20130207alchemy-api-raises-2-million-for-neural-net-analysis-tech-on-par-with-ibm-watson-google/AlchemyAPIは、固有名抽出(NER)とか極…

Beyond Normalization: Pragmatics of Word Form in Text Messages

IJCNLP2011Tyler Baldwin, Joyce Y. Chai Michigan State UniversityOOVの正規化論文。 この論文では、OOVというのは単にIVの揺れというだけではなく、感情や強調などといった書き手の気持ちが含まれていると主張している。例えば、 A: They won the game! B…

A Character-Level Machine Translation Approach for Normalization of SMS Abbreviations

IJCNLP2011Deana L. Pennell, Yang Liu The University of Texas at Dallas非常に読みづらい。わかりづらい。 本文中に出てくる数字の意味がわからなかったり、図表が説明不足or本文と一致がとれなかったりで私には理解できなかった。 英語力の問題ならいつ…

Improving Text Normalization Using Character-blocks based Models and System Combination

COLING2012Chen Li and Yang Liu Department of Computer Science The University of Texas at Dallas細かいことを色々やっているが、そのあたりは省略。 大きなポイントだけおさえる。筆者らの言葉を使えば、character-levelの機械翻訳(MT)をcharacter-bl…

A Broad-Coverage Normalization System for Social Media Language

ACL2012Fei Liu, Fuliang Weng, Xiao Jiang Research and Technology Center, Robert Bosch LLCTwitterを対象にしたテキストNormalizationの論文。 人間の知覚に基づいた3つのアプローチにより正規化候補を算出する。 それぞれ、 Enhanced letter transform…