锵锵~ 大家好哇!我是又在研究数据分析的卫星酱~
之前,卫某对「脏」数据的清洗方法做了一个简单的介绍。
不得不说,清洗、整理过的数据,再进行分析会方便很多。
这次,我又带来了 7 个用于数据清洗的函数,帮助大家提高整理数据的效率!
一起看看吧~
1、清除
第一类是最直接的,就是除掉不需要的数据。
从其他应用程序导入的文本,可能含有当前操作系统无法打印的字符,所以我们可用 CLEAN 函数清除这些非打印字符。
如图,用 VLOOKUP 函数查找「赵六」的业绩时,结果居然出错:
用 LEN 函数检查 B 列的字符数,发现 B5 单元格多了一个不可见字符:
用 CLEAN 函数清除它:
=VLOOKUP(E2,CLEAN(B2:C5),2,FALSE)
这样 VLOOKUP 函数就能正常查找啦!
TRIM 函数,能够清除文本中的所有空格(除了单词之间的单个空格)。
如果你从网页导入的文本中有许多空格,那用 TRIM 就对了!
=TRIM(A1)
单词前的空格全部清除了,单词间距的空格却得到保留。
用函数清洗数据,省时又省力~
2、替换
回到之前的例子,用 VLOOKUP 函数查找员工业绩,却因为单元格 B5 中有个不可见字符而出现错误值:
要想避免错误值干扰数据分析,就得用 IFERROR 函数:以给定值,替换数据中的错误值。
=IFERROR(VLOOKUP(E2$B$2$C$5,2,FALSE)"")
REPLACE 也是一个替换函数,只不过应用范围比 IFERROR 要广。
将某值替换成给定的另一值,这就是它的作用。
一般我们用它来给电话号码、身份证号或者其他个人信息打码。
=REPLACE(C2,7,8,"****")
用替换函数将数据快速处理一遍,就不担心隐私泄露了~
3、提取
第三种数据清洗函数是提取类,较常用的就是左、中、右三兄弟,也就是 LEFT、MID 和 RIGHT。
数据提取,也可以理解为清洗冗杂的数据,留下我们需要的部分。
▋01 提取地区代码(求籍贯)
=LEFT(C2,6)
▋02 提取生日
=MID(C2,7,8)
▋03 提取文件扩展名
=RIGHT(B2,LEN(B2)-FIND(".",B2))
4、写在最后
好了,今天我们一口气学习了 7 个数据清洗函数!
❶ CLEAN
❷ TRIM
❸ IFERROR
❹ REPLACE
❺ LEFT
❻ RIGHT
❼ MID
大家还记得这些函数的运用场景吗?试着回忆一下~
补充阅读:Excel 里把人「逼疯」的杂乱数据,原来 1 分钟就能整理好!
本文来自微信公众号:秋叶 Excel (ID:excel100),作者:卫星酱