R语言字符串类整理
R语言字符串类整理
# 字符串类
提示
字符串类允许指定完整类别的字符,如数字、字母等。字符类有两种风格,一种使用[:和:]括在方括号内的预定义名称周围,另一种使用\和特殊字符。
[:digit:]或\d:数字 0 1 2 3 4 5 6 7 8 9,相当于[0-9]。\D:非数字,相当于[^0-9]。[:lower:]:小写字母,相当于[a-z]。[:upper:]:大写字母,相当于[A-Z]。[:alpha:]:所有字母,相当于[[:lower:][:upper:]]or[A-z]。[:alnum:]: 字母和数字,相当于[[:alpha:][:digit:]]或[A-z0-9]。\w:单词字符,相当于[[:alnum:]_]or[A-z0-9_]。\W: 非单词字符,相当于[^A-z0-9_]。[:xdigit:]:16进制字符组,相当于[0-9A-Fa-f]。[:blank:]:空白字符,比如空格和制表符。[:space:]:间隔字符,包括制表符,换行符,垂直制表符,换页符,回车以及空格。\s:空格。\S:非空格。[:punct:]: 标点符号,包括``! " # $ % & ’ ( ) * + , - . / : ; < = > ? @ [ ] ^ _{ | } ~```。[:graph:]: 图形字符(人类友好字符),相当于[[:alnum:][:punct:]]。[:print:]: 可打印字符,相当于[[:alnum:][:punct:]\\s]。[:cntrl:]: 控制符,例如\n、\r,相当于[\x00-\x1F\x7F]。
# 示例
# Function to clean text
clean.text <- function(text){
text <- gsub("[^[:alnum:]]", "", text)
text <- gsub(" ", "", text)
text <- tolower(text)
return(text)
}
1
2
3
4
5
6
7
2
3
4
5
6
7
上次更新: 2024/03/11, 23:50:27