例如,某数据库如下,需要把第二个变量里面的ID号码(格式为T-20-252-02)提取出来作为一个新变量。

R语言-如何截取变量中指定位置的若干个字符

命令如下:

b=readWorksheetFromFile(temp[11],sheet=1)   

读入excel数据,命名为数据库b,这里temp[11]是读入temp中第11个文件名对应的文件

attach(b) 

attach数据库,之后即可直接用变量名file, 否则要用b$file

b$id=substr(File,regexpr("T",File),regexpr("T",File)+10)  

在数据库b中生成一个新变量id,其等于从File变量中提取字符,从T所在位置开始,到T位置后10位置结束

结果如下所示:

R语言-如何截取变量中指定位置的若干个字符

补充:R语言提取字符串的一部分substring函数

语法

这个函数提取字符串的一部分。

substring()函数的基本语法是:

substring(x,first,last)

x – 是字符向量输入。

first – 是第一个字符要被提取的位置。

last – 是最后一个字符要被提取的位置。

示例

# Extract characters from 5th to 7th position.
substring("Extract", 5, 7)
> [1] "act"

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。