Linux中文件名解析处理源码分析

文章由LinuxBoy分享于2019-03-31 01:03:54热评（594）

Linux中文件名解析处理源码分析

前言

Linux中对一个文件进行操作的时候，一件很重要的事情是对文件名进行解析处理，并且找到对应文件的inode对象，然后创建表示文件的file对象。在此，对文件名解析过程，并且如何找到对应inode的过程进行源码分析。分析代码基于Linux-3.2版本。

关键函数分析

不管是通过应用层的API函数还是在内核中打开一个文件，最终都需要调用filp_open函数，该函数的主要职责就是解析文件名，找到文件对应的inode对象，然后分配内存创建file对象，最后执行该文件对应的file->open函数。

filp_open的核心处理函数是path_openat，该函数分析如下：

static struct file *path_openat(int dfd, const char *pathname,
struct nameidata *nd, const struct open_flags *op, int flags)
{
struct file *base = NULL;
struct file *filp;
struct path path;
int error;
/* 创建一个file对象 */
filp = get_empty_filp();
if (!filp)
return ERR_PTR(-ENFILE);

.filp->f_flags = op->open_flag;
nd->intent.open.file = filp;
nd->intent.open.flags = open_to_namei_flags(op->open_flag);
nd->intent.open.create_mode = op->mode;
/* 初始化检索的起始目录，判断起始目录是根目录还是当前目录，并且初始化nd->inode对象，为link_path_walk函数的解析处理做准备。 */
error = path_init(dfd, pathname, flags | LOOKUP_PARENT, nd, &base);
if (unlikely(error))
goto out_filp;

.current->total_link_count = 0;
/* 关键的字符串解析处理函数，其核心思想是分级解析字符串，通过字符串对应的目录项找到下一级目录的inode节点。该函数的具体分析如下。 */
error = link_path_walk(pathname, nd);
if (unlikely(error))
goto out_filp;
/* do_last函数创建或者获取文件对应的inode对象，并且初始化file对象，至此一个表示打开文件的内存对象filp诞生 */
filp = do_last(nd, &path, op, pathname);
while (unlikely(!filp)) { /* trailing symlink */
struct path link = path;
void *cookie;
if (!(nd->flags & LOOKUP_FOLLOW)) {
path_put_conditional(&path, nd);
path_put(&nd->path);
filp = ERR_PTR(-ELOOP);
break;
}
nd->flags |= LOOKUP_PARENT;
nd->flags &= ~(LOOKUP_OPEN|LOOKUP_CREATE|LOOKUP_EXCL);
error = follow_link(&link, nd, &cookie);
if (unlikely(error))
filp = ERR_PTR(error);
else
filp = do_last(nd, &path, op, pathname);
put_link(nd, &link, cookie);
}
out:
if (nd->root.mnt && !(nd->flags & LOOKUP_ROOT))
path_put(&nd->root);
if (base)
fput(base);
release_open_intent(nd);
return filp;

.out_filp:
filp = ERR_PTR(error);
goto out;
}

link_path_walk函数完成了基本的名字解析功能，是名字字符串解析处理实现的核心。该函数的实现基于分级解析处理的思想。例如，当需要解析“/dev/mapper/map0”字符串时，其首先需要判断从何处开始解析？根目录还是当前目录？案例是从根目录开始解析，那么获取根目录的dentry对象并开始分析后继字符串。以’/’字符为界按序提取字符串，首先我们可以提取”dev”字符串，并且计算该字符串的hash值，通过该hash值查找detry下的inode hash表，就可以得到/dev/目录的inode对象。依次类推，最后解析得到”/dev/mapper/”目录的inode对象以及文件名”map0”。至此，link_path_walk函数的使命完成，最后可以通过do_last函数获取或者创建文件inode。link_path_walk函数分析如下：

static int link_path_walk(const char *name, struct nameidata *nd)
{
struct path next;
int err;
/* 移除’/’字符 */
while (*name=='/')
name++;
/* 如果解析已经完成，直接返回 */
if (!*name)
return 0;

./* At this point we know we have a real path component. */
for(;;) {
unsigned long hash;
struct qstr this;
unsigned int c;
int type;
/* inode访问的permission检查 */
err = may_lookup(nd);
if (err)
break;

.this.name = name;
c = *(const unsigned char *)name;
/* 初始化hash值 */
hash = init_name_hash();
do {
name++;
/* 累计计算名字字符串的hash值 */
hash = partial_name_hash(c, hash);
c = *(const unsigned char *)name;
/* 如果遇到’/’字符，结束一次hash计算统计 */
} while (c && (c != '/'));
/* 得到字符串长度和hash结果 */
this.len = name - (const char *) this.name;
this.hash = end_name_hash(hash);

.type = LAST_NORM;
/* LAST_DOT和LAST_DOTDOT情形判断 */
if (this.name[0] == '.') switch (this.len) {
case 2: /* LAST_DOTDOT是上级目录 */
if (this.name[1] == '.') {
type = LAST_DOTDOT;
nd->flags |= LOOKUP_JUMPED;
}
break;
case 1: /* LAST_DOT是当前目录 */
type = LAST_DOT;
}
if (likely(type == LAST_NORM)) {
/* LAST_NORM标记说明是需要通过本地目录进行字符串解析 */
struct dentry *parent = nd->path.dentry;
nd->flags &= ~LOOKUP_JUMPED;
if (unlikely(parent->d_flags & DCACHE_OP_HASH)) {
/* 如果该标记有效，需要重新计算hash值 */
err = parent->d_op->d_hash(parent, nd->inode,
&this);
if (err <0)
break;
}
}
/* 如果字符串已经解析完毕，直接跳转到last_component */
/* remove trailing slashes? */
if (!c)
goto last_component;
while (*++name == '/');
if (!*name)
goto last_component;
/* 通过walk_component函数找到解析字符串对应的inode，并且将nd->inode改称最新inode，准备继续解析后面的字符串信息。因为目录项所管理的inode在系统中通过hash表进行维护，因此，通过hash值可以很容易的找到inode。如果内存中还不存在inode对象，对于ext3文件系统会通过ext3_lookup函数从磁盘上获取inode的元数据信息，并且构造目录项中所有的inode对象。 */
err = walk_component(nd, &next, &this, type, LOOKUP_FOLLOW);
if (err <0)
return err;

.if (err) {
err = nested_symlink(&next, nd);
if (err)
return err;
}
if (can_lookup(nd->inode))
continue;
/* 字符串还没有解析完毕，但是当前的inode已经继续不允许解析处理了，所以，返回错误码 */
err = -ENOTDIR;
break;
/* here ends the main loop */

.last_component:
/* 最后一个字符串不需要解析处理，需要由do_last函数来处理，此处结束解析，正确返回 */
nd->last = this;
nd->last_type = type;
return 0;
}
terminate_walk(nd);
return err;
}

小结

文件名解析处理是文件系统的必备功能，通过文件名的解析索引到表示文件的inode内存对象，并且创建文件对象file。在文件名解析的过程中，首先需要确定的是检索起始点，然后通过hash table查找目录项以及检索文件。在查找的过程中，需要考虑文件访问的权限以及符号连接等问题。总体来说这些代码难度不是很大，但是需要有一个整体的思路，就可以更好的理解分析代码了，这里只是对名字解析过程中的几个关键函数进行抛砖引玉式的分析。不正之处，敬请指出。

推荐文章：

Linux源码分析：completion的解读

Linux中文件名解析处理源码分析