Excelの自動書式により、遺伝子のリストを使用する論文の約20%に誤った遺伝子シンボルが掲載されているとの調査結果
2016年8月28日 14:58
Microsoft Excelの自動書式機能により、遺伝子のリストを使用する論文の約20%で、遺伝子シンボルが日付や浮動小数点値に変換されたまま掲載されていることがわかったそうだ(論文、Softpediaの記事、WinBetaの記事)。 たとえば「Septin 2」の遺伝子シンボルは「SEPT2」だが、デフォルトの状態でExcelに入力すると「2-Sep」に変換される。また、「Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase」の遺伝子シンボル「MARCH1」は「1-Mar」に変換されるほか、理研の「2310009E13」のようなクローンIDは「2.31E+19」に変換されてしまう。保持されるデータ自体が変換されてしまうため、後で書式を変更しても復元することはできない。 同様の変換はExcelだけでなく、LibreOffice CalcやApache OpenOffice Calcでも発生する。Googleスプレッドシートでは発生しないとのことだが、試してみたところクローンIDは変換されてしまった。 こういった問題と回避方法は10年以上前から注目されている。しかし、事前にセルの書式設定で「文字列」を選ぶか、先頭に「'」を付加して文字列として 入力する方法ぐらいで、完全に無効化する方法はないこともあり、簡単にはなくならないようだ。 スラドのコメントを読む | ITセクション | ソフトウェア | マイクロソフト | バイオテック | サイエンス | 数学
関連ストーリー: Excelの「置換(ちかん)」を「置き換え」などに変更して欲しいという要望が出される 2015年09月17日 Excelの操作ミスで情報漏洩、ソート時に別の人の個人情報が混入 2015年09月10日 「Excel方眼紙」推進派が語る、「Excel方眼紙の何が悪い?」 2014年03月28日 「ネ申Excel」はなぜ問題なのか 2013年10月23日 Excelを正しく使うにはどうすれば良い? 2013年03月12日