北京大学生物信息平台论坛

 找回密码
 立即注册
搜索
热搜: 通知 活动

Excel中的基因名称变为日期

[复制链接]
licheng 发表于 2016-5-26 23:44:00 | 显示全部楼层 |阅读模式
【问】你之前给我的基因列表excel文件里面有些基因名是日期,是什么原因?

【答】Excel会把有些基因名字转换为日期,如Oct4成为10月4号,最好把数据一直存为文本文件,如CSV格式,读入R以后不会出问题。

【解决办法,by WEI Mian】
好像是导入csv到excel时格式设置的问题。因为之前是用Excel做的差异表达分析,所以存成了excel。导入时设置格式好像就可以避免这个问题。导入csv到excel时,设置基因名那一列格式为text就可以。

【更多信息】
为这个问题2004年发表的论文和解决办法:
http://bmcbioinformatics.biomedc ... 1186/1471-2105-5-80
IMG_20160526_235613.png
IMG_20160526_235640.png

http://www.chinapubmed.net/15214961
错误的标识符:当在生物信息学中使用Excel时,基因名字错误能够被不经意的引入

背景:当处理微阵列数据集时,我们最近注意到一些基因名字正在被不经意地转变为非基因名字。结果:一些侦探工作追踪该问题到在非常有用的Excel程序包中默认的日期格式转换和小数点格式转换。日期转换影响了至少30个基因名字;若包括日本理研所(Riken)标识符,浮点数转换影响了至少2000个基因名字。这些转换是不可逆的;最初的基因名字不能被恢复。结论:用Excel进行涉及到基因名字分析的用户应该注意到这个问题,它能够导致基因,包括医学上重要的名字,从视图中丢失,并且这甚至已经污染了仔细精选的公共数据库。我们提供了应急措施和脚本来避免这个问题。

但2012年还是有新手犯错:
https://nsaunders.wordpress.com/ ... essons-not-learned/
回复

使用道具 举报

北京大学生物信息平台论坛

GMT+8, 2017-11-19 21:56 , Processed in 0.077156 second(s), 29 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表