■ 研究経験 - 大規模コーパスからの語彙知識獲得 自然言語処理において、同義語や、上位・下位関係などの語彙知識を大規模コーパスから自動獲得することは重要な問題であり、辞書やシソーラスの構築など応用範囲も幅広い。語彙の関連度を測定する指標として、文脈の類似度を利用した「分布類似度」が広く用いられてきたが、この分布類似度に用いる文脈情報の抽出、選択、拡張に注目し、いくつかの拡張および選択手法を提案した。WordNet等、既存のシソーラスを用いた評価により、本手法の有効性を確認した。 また、語彙知識獲得の際には、語と文脈の共起関係をモデル化する必要がある。ここに、確率的潜在意味モデル(PLSA)等を適用することにより、スパースネス等の問題を解決し、性能の向上を図った。 さらに、文脈パターンと機械学習を組み合わせた語彙知識獲得にも取り組んでおり、最近の成果では、ベクトル空間モデルや分布類似度を用いた従来手法と比較し、50%以上もの性能向上を実現した。 - 日本語クエリ書き換え Web検索エンジンにおいて、クエリの訂正技術はロバストな検索を実現する上で重要である。Microsoft Researchにおいて取り組んだインターンのプロジェクトにおいては、日本語のクエリ書き換えのための統一的アプローチを提案・実装した。本手法は、基本的には従来の英語スペル訂正手法に基づいているが、(1)表記・綴りの上では異なるが意味的に類似した候補への書き換えを扱うことができ、(2)意味的類似度に基づくカーネル法を用いて、書き換え候補間の類似度を計算する際のスパースネスを軽減できるという点に新規性がある。 また、書き換えモデルに対する訓練およびテストセットを検索セッションログから効率的に生成する手法を提案した。クエリ書き換えタスクにおいて、提案手法は英語のクエリ訂正に関する従来手法と比較して優れた性能を示した。 ■ 開発経験 - Serendi (http://serendi.org/) 情報処理推進機構(IPA)2006年度下期未踏ソフトウェア創造事業採択プロジェクト。David J. Farber教授監修の下、「Serendi: A Location-Aware Social Networking Platform」に主開発エンジニアの一人として参加し、携帯端末を対象とした位置情報適応型メタSNSプラットフォーム「Serendi」を開発した。主に、自然言語処理およびネットワーク解析技術に基づいた類似度計算手法を用い、ユーザー間の「Compatibiliby(相性)」を解析するモジュールを担当した。 - frippa (http://www.frippa.com/) 地域型個人間取引仲介・案内・3行広告Webサービス。システム全体の開発を担当した。Linux, MySQL, ActiveRecord, Rubyなど個別の技術をベースにした独自MVCフレームワークを構築しその上で動作している。自然言語処理に基づいた類似商品検索機能を実装。現在約2,000人のユーザーが参加しており、活発な個人間取引サイトへと成長した。また、2007年度名古屋大学下宿用品リユース市との共同プロジェクトにより登録物品データベースを技術提供するなどの社会貢献実績もある。 - その他に、RINEN.inc (http://rinen.cc/), Anchor (http://anchor.vc/)などIT系ベンチャー企業においてアルバイトとして開発経験がある。 ■ 学歴 2006.4 - 2009.3 名古屋大学 大学院 情報科学研究科 情報システム学専攻 博士課程後期課程 (修了見込み) 2004.4 - 2006.3 名古屋大学 大学院 情報科学研究科 情報システム学専攻 博士課程前期課程 修士(情報科学) 論文題目:「Utilization of Probabilistic Latent Semantics for Automatic Thesaurus Construction」 GPA: 3.8 2001.4 - 2004.3 名古屋大学 工学部 電気電子・情報工学科 飛び級入学のため退学、GPA: 3.9 ■ 職歴 - 2008.4 - 2008.7 リサーチ・インターン Microsoft Research (米国ワシントン・レッドモンド) 鈴木久美氏の下、日本語クエリ書き換えのプロジェクトに従事 - 2006.11 - 2007.8 開発エンジニア 情報処理推進機構(IPA) 2006年度下期 未踏ソフトウェア創造事業 David J. Farber PM監修 プロジェクト:「Serendi: A Location-Aware Social Networking Platform」 - 2006.4 - 2007.3 リサーチ・アシスタント(RA) 名古屋大学大学院情報科学研究科 21世紀COEプログラム「社会情報基盤のための音声・映像の知的統合」 - 2006.9 - 2007.3 ティーチング・アシスタント(TA) 名古屋大学大学院情報科学研究科 オートマトンと形式言語理論 - 2005.9 - 2006.3 ティーチング・アシスタント(TA) 名古屋大学大学院工学研究科 線形代数および演習 - 2005.8 - 2005.9 インターン (Software Enineer) Google Inc. (米国カリフォルニア・マウンテンビュー) Dekang Lin氏、Jun Wu氏の下、日本語クエリ・サジェスチョンのプロジェクトに従事 ■ 主要論文・発表 * 論文誌(査読あり) - Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama. Supervised Synonym Acquisition Using Distributional Features and Syntactic Patterns. Journal of Natural Language Processing, 2009 (accepted with minor revision). - Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama. A Comparative Study on Effective Context Selection for Distributional Similarity. Journal of Natural Language Processing, 2008 (to appear). - Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama. Effective Use of Indirect Dependency for Distributional Similarity. Journal of Natural Language Processing, Vol. 15, Num. 4, pp. 19-42, 2008. - Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama. Bootstrapping-based Extraction of Dictionary Terms from Unsegmented Legal Text. New Frontiers in Artificial Intelligence: JSAI 2008 Conference and Workshops, Revised Selected papers, Lecture Notes in Computer Science, 14 pages (to appear). * 国際会議・ワークショップ(査読あり) - Nobuyuki Shimizu, Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama, Hiroshi Nakagawa. Metric Learning for Synonym Acquisition, Proceedings of COLING 2008, pp. 793-800, 2008. - Masato Hagiwara. A Supervised Learning Approach to Automatic Synonym Identification based on Distributional Features. Proceedings of ACL 2008 Student Research Workshop, pp. 1-6, 2008. - Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama. Bootstrapping-based Extraction of Dictionary Terms from Unsegmented Legal Text. Proceedings of the Second International Workshop on Juris-Informatics (JURISIN2008), pp. 63-72, 2008. - Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama. Context Feature Selection for Distributional Similarity. Proceedings of IJCNLP 2008, pp. 553-560, 2008. - Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama. Effective Proximity Distance for Word-Based Context. Proceedings of SNLP 2007, pp. 105 - 110, 2007. - Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama. Effectiveness of Indirect Dependency for Automatic Synonym Acquisition. Proceedings of CoSMo 2007, pp. 1 - 8, 2007. - Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama. Selection of Effective Contextual Information for Automatic Synonym Acquisition. Proceedings of COLING/ACL 2006, pp. 353 - 360, 2006. - Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama. PLSI Utilization for Automatic Thesaurus Construction. Proceedings of IJCNLP 2005, pp. 334 - 345, 2005. * 国内会議・ワークショップ(査読あり) 萩原正人,小川泰弘,外山勝彦.類義語自動獲得における間接依存関係の有効性. 言語処理学会第13回年次大会ワークショップ「言語的オントロジーの構築・連携・利用」論文集 pp. 43-46, 2007. * その他学会・ワークショップ(査読なし) 萩原正人, 鈴木久美. 意味的類似度を利用した日本語クエリ書き換えのための統一的アプローチ. NLP若手の会 第3回シンポジウム, 発表20, 2008. 萩原正人, 小川泰弘, 外山勝彦. 分布類似度のための文脈素性選択. NLP若手の会 第2回シンポジウム, 発表11, 2007. 萩原正人, 小川泰弘, 外山勝彦. perplexityを用いた類義語獲得の自動評価, 言語処理学会第12回年次大会予稿集,B4-4 (pp. 767-770), 2006. 萩原正人, 小川泰弘, 外山勝彦. 文脈として有効な近接語の距離. 2006年度電気関係学会東海支部連合大会講演論文集, O-394, 2006. 萩原正人, 小川泰弘,外山勝彦. シソーラス自動構築におけるPLSIの利用.情報処理学会 第166回自然言語処理研究会, 2005-NL-166, pp.71-78, 2005. 萩原正人, 小川泰弘,外山勝彦. 索引語ペアを用いた多言語シソーラスの自動構築.第3回情報技術フォーラム(FIT2004), pp. 209-212, 2004. ■ 言語スキル - 日本語:ネイティブ - 英語:会話・読み書き上級 TOEIC 960点 (2007年取得) - 中国語・フランス語:初級 ■ 技術スキル - 言語:C, C++, C#, Java, Ruby, PHP, JavaScript, SQL, (D)HTML, ActionScript - OS:Windows, Linux LAMPアーキテクチャに基づいたWebアプリケーション経験(3年以上) ■ その他特筆すべき事項 - NLP若手の会 第3回シンポジウム 奨励賞受賞 発表:「意味的類似度を利用した日本語クエリ書き換えのための統一的アプローチ」 - 21世紀COEプログラム「社会情報基盤のための音声・映像の知的統合」 第22回IMIセミナー 優秀賞受賞 発表:「シソーラス自動構築における確率的潜在意味の利用」 - ACL-IJCNLP 2009 (Joint conference of the 47th Annual Meeting of the Association for Computational Linguistics and the 4th International Joint Conference on Natural Language Processing) Student Research Workshop プログラム委員 (http://www.acl-ijcnlp-2009.org/main/studentresearch.html) - 名古屋大学大学院情報科学研究科へ成績優秀のため飛び級入学。当該研究科において初の飛び級事例となる。学部3年次に卒業論文相当の研究に取り組む(題目:「クロスリンガル情報検索のための多言語シソーラス自動構築に関する研究」) - 大学院の学生を中心とした英語発表・プレゼンテーションについての勉強会を発足・運営し、週1回、各専門分野の議論を通じて英語力の向上を図る(1年間) - 留学生のメンター経験(2年間) 言語・文化・専門分野の面で指導およびサポート - 日英翻訳実務経験(3年間) 生物医学・歯学、特許翻訳等の分野において従事