]> bbs.cooldavid.org Git - net-next-2.6.git/blob - fs/configfs/dir.c
configfs: Silence lockdep on mkdir(), rmdir() and configfs_depend_item()
[net-next-2.6.git] / fs / configfs / dir.c
1 /* -*- mode: c; c-basic-offset: 8; -*-
2  * vim: noexpandtab sw=8 ts=8 sts=0:
3  *
4  * dir.c - Operations for configfs directories.
5  *
6  * This program is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU General Public
8  * License as published by the Free Software Foundation; either
9  * version 2 of the License, or (at your option) any later version.
10  *
11  * This program is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * General Public License for more details.
15  *
16  * You should have received a copy of the GNU General Public
17  * License along with this program; if not, write to the
18  * Free Software Foundation, Inc., 59 Temple Place - Suite 330,
19  * Boston, MA 021110-1307, USA.
20  *
21  * Based on sysfs:
22  *      sysfs is Copyright (C) 2001, 2002, 2003 Patrick Mochel
23  *
24  * configfs Copyright (C) 2005 Oracle.  All rights reserved.
25  */
26
27 #undef DEBUG
28
29 #include <linux/fs.h>
30 #include <linux/mount.h>
31 #include <linux/module.h>
32 #include <linux/slab.h>
33 #include <linux/err.h>
34
35 #include <linux/configfs.h>
36 #include "configfs_internal.h"
37
38 DECLARE_RWSEM(configfs_rename_sem);
39 /*
40  * Protects mutations of configfs_dirent linkage together with proper i_mutex
41  * Also protects mutations of symlinks linkage to target configfs_dirent
42  * Mutators of configfs_dirent linkage must *both* have the proper inode locked
43  * and configfs_dirent_lock locked, in that order.
44  * This allows one to safely traverse configfs_dirent trees and symlinks without
45  * having to lock inodes.
46  *
47  * Protects setting of CONFIGFS_USET_DROPPING: checking the flag
48  * unlocked is not reliable unless in detach_groups() called from
49  * rmdir()/unregister() and from configfs_attach_group()
50  */
51 DEFINE_SPINLOCK(configfs_dirent_lock);
52
53 static void configfs_d_iput(struct dentry * dentry,
54                             struct inode * inode)
55 {
56         struct configfs_dirent * sd = dentry->d_fsdata;
57
58         if (sd) {
59                 BUG_ON(sd->s_dentry != dentry);
60                 sd->s_dentry = NULL;
61                 configfs_put(sd);
62         }
63         iput(inode);
64 }
65
66 /*
67  * We _must_ delete our dentries on last dput, as the chain-to-parent
68  * behavior is required to clear the parents of default_groups.
69  */
70 static int configfs_d_delete(struct dentry *dentry)
71 {
72         return 1;
73 }
74
75 static struct dentry_operations configfs_dentry_ops = {
76         .d_iput         = configfs_d_iput,
77         /* simple_delete_dentry() isn't exported */
78         .d_delete       = configfs_d_delete,
79 };
80
81 /*
82  * Allocates a new configfs_dirent and links it to the parent configfs_dirent
83  */
84 static struct configfs_dirent *configfs_new_dirent(struct configfs_dirent * parent_sd,
85                                                 void * element)
86 {
87         struct configfs_dirent * sd;
88
89         sd = kmem_cache_zalloc(configfs_dir_cachep, GFP_KERNEL);
90         if (!sd)
91                 return ERR_PTR(-ENOMEM);
92
93         atomic_set(&sd->s_count, 1);
94         INIT_LIST_HEAD(&sd->s_links);
95         INIT_LIST_HEAD(&sd->s_children);
96         sd->s_element = element;
97         spin_lock(&configfs_dirent_lock);
98         if (parent_sd->s_type & CONFIGFS_USET_DROPPING) {
99                 spin_unlock(&configfs_dirent_lock);
100                 kmem_cache_free(configfs_dir_cachep, sd);
101                 return ERR_PTR(-ENOENT);
102         }
103         list_add(&sd->s_sibling, &parent_sd->s_children);
104         spin_unlock(&configfs_dirent_lock);
105
106         return sd;
107 }
108
109 /*
110  *
111  * Return -EEXIST if there is already a configfs element with the same
112  * name for the same parent.
113  *
114  * called with parent inode's i_mutex held
115  */
116 static int configfs_dirent_exists(struct configfs_dirent *parent_sd,
117                                   const unsigned char *new)
118 {
119         struct configfs_dirent * sd;
120
121         list_for_each_entry(sd, &parent_sd->s_children, s_sibling) {
122                 if (sd->s_element) {
123                         const unsigned char *existing = configfs_get_name(sd);
124                         if (strcmp(existing, new))
125                                 continue;
126                         else
127                                 return -EEXIST;
128                 }
129         }
130
131         return 0;
132 }
133
134
135 int configfs_make_dirent(struct configfs_dirent * parent_sd,
136                          struct dentry * dentry, void * element,
137                          umode_t mode, int type)
138 {
139         struct configfs_dirent * sd;
140
141         sd = configfs_new_dirent(parent_sd, element);
142         if (IS_ERR(sd))
143                 return PTR_ERR(sd);
144
145         sd->s_mode = mode;
146         sd->s_type = type;
147         sd->s_dentry = dentry;
148         if (dentry) {
149                 dentry->d_fsdata = configfs_get(sd);
150                 dentry->d_op = &configfs_dentry_ops;
151         }
152
153         return 0;
154 }
155
156 static int init_dir(struct inode * inode)
157 {
158         inode->i_op = &configfs_dir_inode_operations;
159         inode->i_fop = &configfs_dir_operations;
160
161         /* directory inodes start off with i_nlink == 2 (for "." entry) */
162         inc_nlink(inode);
163         return 0;
164 }
165
166 static int configfs_init_file(struct inode * inode)
167 {
168         inode->i_size = PAGE_SIZE;
169         inode->i_fop = &configfs_file_operations;
170         return 0;
171 }
172
173 static int init_symlink(struct inode * inode)
174 {
175         inode->i_op = &configfs_symlink_inode_operations;
176         return 0;
177 }
178
179 static int create_dir(struct config_item * k, struct dentry * p,
180                       struct dentry * d)
181 {
182         int error;
183         umode_t mode = S_IFDIR| S_IRWXU | S_IRUGO | S_IXUGO;
184
185         error = configfs_dirent_exists(p->d_fsdata, d->d_name.name);
186         if (!error)
187                 error = configfs_make_dirent(p->d_fsdata, d, k, mode,
188                                              CONFIGFS_DIR | CONFIGFS_USET_CREATING);
189         if (!error) {
190                 error = configfs_create(d, mode, init_dir);
191                 if (!error) {
192                         inc_nlink(p->d_inode);
193                         (d)->d_op = &configfs_dentry_ops;
194                 } else {
195                         struct configfs_dirent *sd = d->d_fsdata;
196                         if (sd) {
197                                 spin_lock(&configfs_dirent_lock);
198                                 list_del_init(&sd->s_sibling);
199                                 spin_unlock(&configfs_dirent_lock);
200                                 configfs_put(sd);
201                         }
202                 }
203         }
204         return error;
205 }
206
207
208 /**
209  *      configfs_create_dir - create a directory for an config_item.
210  *      @item:          config_itemwe're creating directory for.
211  *      @dentry:        config_item's dentry.
212  *
213  *      Note: user-created entries won't be allowed under this new directory
214  *      until it is validated by configfs_dir_set_ready()
215  */
216
217 static int configfs_create_dir(struct config_item * item, struct dentry *dentry)
218 {
219         struct dentry * parent;
220         int error = 0;
221
222         BUG_ON(!item);
223
224         if (item->ci_parent)
225                 parent = item->ci_parent->ci_dentry;
226         else if (configfs_mount && configfs_mount->mnt_sb)
227                 parent = configfs_mount->mnt_sb->s_root;
228         else
229                 return -EFAULT;
230
231         error = create_dir(item,parent,dentry);
232         if (!error)
233                 item->ci_dentry = dentry;
234         return error;
235 }
236
237 /*
238  * Allow userspace to create new entries under a new directory created with
239  * configfs_create_dir(), and under all of its chidlren directories recursively.
240  * @sd          configfs_dirent of the new directory to validate
241  *
242  * Caller must hold configfs_dirent_lock.
243  */
244 static void configfs_dir_set_ready(struct configfs_dirent *sd)
245 {
246         struct configfs_dirent *child_sd;
247
248         sd->s_type &= ~CONFIGFS_USET_CREATING;
249         list_for_each_entry(child_sd, &sd->s_children, s_sibling)
250                 if (child_sd->s_type & CONFIGFS_USET_CREATING)
251                         configfs_dir_set_ready(child_sd);
252 }
253
254 /*
255  * Check that a directory does not belong to a directory hierarchy being
256  * attached and not validated yet.
257  * @sd          configfs_dirent of the directory to check
258  *
259  * @return      non-zero iff the directory was validated
260  *
261  * Note: takes configfs_dirent_lock, so the result may change from false to true
262  * in two consecutive calls, but never from true to false.
263  */
264 int configfs_dirent_is_ready(struct configfs_dirent *sd)
265 {
266         int ret;
267
268         spin_lock(&configfs_dirent_lock);
269         ret = !(sd->s_type & CONFIGFS_USET_CREATING);
270         spin_unlock(&configfs_dirent_lock);
271
272         return ret;
273 }
274
275 int configfs_create_link(struct configfs_symlink *sl,
276                          struct dentry *parent,
277                          struct dentry *dentry)
278 {
279         int err = 0;
280         umode_t mode = S_IFLNK | S_IRWXUGO;
281
282         err = configfs_make_dirent(parent->d_fsdata, dentry, sl, mode,
283                                    CONFIGFS_ITEM_LINK);
284         if (!err) {
285                 err = configfs_create(dentry, mode, init_symlink);
286                 if (!err)
287                         dentry->d_op = &configfs_dentry_ops;
288                 else {
289                         struct configfs_dirent *sd = dentry->d_fsdata;
290                         if (sd) {
291                                 spin_lock(&configfs_dirent_lock);
292                                 list_del_init(&sd->s_sibling);
293                                 spin_unlock(&configfs_dirent_lock);
294                                 configfs_put(sd);
295                         }
296                 }
297         }
298         return err;
299 }
300
301 static void remove_dir(struct dentry * d)
302 {
303         struct dentry * parent = dget(d->d_parent);
304         struct configfs_dirent * sd;
305
306         sd = d->d_fsdata;
307         spin_lock(&configfs_dirent_lock);
308         list_del_init(&sd->s_sibling);
309         spin_unlock(&configfs_dirent_lock);
310         configfs_put(sd);
311         if (d->d_inode)
312                 simple_rmdir(parent->d_inode,d);
313
314         pr_debug(" o %s removing done (%d)\n",d->d_name.name,
315                  atomic_read(&d->d_count));
316
317         dput(parent);
318 }
319
320 /**
321  * configfs_remove_dir - remove an config_item's directory.
322  * @item:       config_item we're removing.
323  *
324  * The only thing special about this is that we remove any files in
325  * the directory before we remove the directory, and we've inlined
326  * what used to be configfs_rmdir() below, instead of calling separately.
327  *
328  * Caller holds the mutex of the item's inode
329  */
330
331 static void configfs_remove_dir(struct config_item * item)
332 {
333         struct dentry * dentry = dget(item->ci_dentry);
334
335         if (!dentry)
336                 return;
337
338         remove_dir(dentry);
339         /**
340          * Drop reference from dget() on entrance.
341          */
342         dput(dentry);
343 }
344
345
346 /* attaches attribute's configfs_dirent to the dentry corresponding to the
347  * attribute file
348  */
349 static int configfs_attach_attr(struct configfs_dirent * sd, struct dentry * dentry)
350 {
351         struct configfs_attribute * attr = sd->s_element;
352         int error;
353
354         dentry->d_fsdata = configfs_get(sd);
355         sd->s_dentry = dentry;
356         error = configfs_create(dentry, (attr->ca_mode & S_IALLUGO) | S_IFREG,
357                                 configfs_init_file);
358         if (error) {
359                 configfs_put(sd);
360                 return error;
361         }
362
363         dentry->d_op = &configfs_dentry_ops;
364         d_rehash(dentry);
365
366         return 0;
367 }
368
369 static struct dentry * configfs_lookup(struct inode *dir,
370                                        struct dentry *dentry,
371                                        struct nameidata *nd)
372 {
373         struct configfs_dirent * parent_sd = dentry->d_parent->d_fsdata;
374         struct configfs_dirent * sd;
375         int found = 0;
376         int err;
377
378         /*
379          * Fake invisibility if dir belongs to a group/default groups hierarchy
380          * being attached
381          *
382          * This forbids userspace to read/write attributes of items which may
383          * not complete their initialization, since the dentries of the
384          * attributes won't be instantiated.
385          */
386         err = -ENOENT;
387         if (!configfs_dirent_is_ready(parent_sd))
388                 goto out;
389
390         list_for_each_entry(sd, &parent_sd->s_children, s_sibling) {
391                 if (sd->s_type & CONFIGFS_NOT_PINNED) {
392                         const unsigned char * name = configfs_get_name(sd);
393
394                         if (strcmp(name, dentry->d_name.name))
395                                 continue;
396
397                         found = 1;
398                         err = configfs_attach_attr(sd, dentry);
399                         break;
400                 }
401         }
402
403         if (!found) {
404                 /*
405                  * If it doesn't exist and it isn't a NOT_PINNED item,
406                  * it must be negative.
407                  */
408                 return simple_lookup(dir, dentry, nd);
409         }
410
411 out:
412         return ERR_PTR(err);
413 }
414
415 /*
416  * Only subdirectories count here.  Files (CONFIGFS_NOT_PINNED) are
417  * attributes and are removed by rmdir().  We recurse, setting
418  * CONFIGFS_USET_DROPPING on all children that are candidates for
419  * default detach.
420  * If there is an error, the caller will reset the flags via
421  * configfs_detach_rollback().
422  */
423 static int configfs_detach_prep(struct dentry *dentry, struct mutex **wait_mutex)
424 {
425         struct configfs_dirent *parent_sd = dentry->d_fsdata;
426         struct configfs_dirent *sd;
427         int ret;
428
429         /* Mark that we're trying to drop the group */
430         parent_sd->s_type |= CONFIGFS_USET_DROPPING;
431
432         ret = -EBUSY;
433         if (!list_empty(&parent_sd->s_links))
434                 goto out;
435
436         ret = 0;
437         list_for_each_entry(sd, &parent_sd->s_children, s_sibling) {
438                 if (!sd->s_element ||
439                     (sd->s_type & CONFIGFS_NOT_PINNED))
440                         continue;
441                 if (sd->s_type & CONFIGFS_USET_DEFAULT) {
442                         /* Abort if racing with mkdir() */
443                         if (sd->s_type & CONFIGFS_USET_IN_MKDIR) {
444                                 if (wait_mutex)
445                                         *wait_mutex = &sd->s_dentry->d_inode->i_mutex;
446                                 return -EAGAIN;
447                         }
448
449                         /*
450                          * Yup, recursive.  If there's a problem, blame
451                          * deep nesting of default_groups
452                          */
453                         ret = configfs_detach_prep(sd->s_dentry, wait_mutex);
454                         if (!ret)
455                                 continue;
456                 } else
457                         ret = -ENOTEMPTY;
458
459                 break;
460         }
461
462 out:
463         return ret;
464 }
465
466 /*
467  * Walk the tree, resetting CONFIGFS_USET_DROPPING wherever it was
468  * set.
469  */
470 static void configfs_detach_rollback(struct dentry *dentry)
471 {
472         struct configfs_dirent *parent_sd = dentry->d_fsdata;
473         struct configfs_dirent *sd;
474
475         parent_sd->s_type &= ~CONFIGFS_USET_DROPPING;
476
477         list_for_each_entry(sd, &parent_sd->s_children, s_sibling)
478                 if (sd->s_type & CONFIGFS_USET_DEFAULT)
479                         configfs_detach_rollback(sd->s_dentry);
480 }
481
482 static void detach_attrs(struct config_item * item)
483 {
484         struct dentry * dentry = dget(item->ci_dentry);
485         struct configfs_dirent * parent_sd;
486         struct configfs_dirent * sd, * tmp;
487
488         if (!dentry)
489                 return;
490
491         pr_debug("configfs %s: dropping attrs for  dir\n",
492                  dentry->d_name.name);
493
494         parent_sd = dentry->d_fsdata;
495         list_for_each_entry_safe(sd, tmp, &parent_sd->s_children, s_sibling) {
496                 if (!sd->s_element || !(sd->s_type & CONFIGFS_NOT_PINNED))
497                         continue;
498                 spin_lock(&configfs_dirent_lock);
499                 list_del_init(&sd->s_sibling);
500                 spin_unlock(&configfs_dirent_lock);
501                 configfs_drop_dentry(sd, dentry);
502                 configfs_put(sd);
503         }
504
505         /**
506          * Drop reference from dget() on entrance.
507          */
508         dput(dentry);
509 }
510
511 static int populate_attrs(struct config_item *item)
512 {
513         struct config_item_type *t = item->ci_type;
514         struct configfs_attribute *attr;
515         int error = 0;
516         int i;
517
518         if (!t)
519                 return -EINVAL;
520         if (t->ct_attrs) {
521                 for (i = 0; (attr = t->ct_attrs[i]) != NULL; i++) {
522                         if ((error = configfs_create_file(item, attr)))
523                                 break;
524                 }
525         }
526
527         if (error)
528                 detach_attrs(item);
529
530         return error;
531 }
532
533 static int configfs_attach_group(struct config_item *parent_item,
534                                  struct config_item *item,
535                                  struct dentry *dentry);
536 static void configfs_detach_group(struct config_item *item);
537
538 static void detach_groups(struct config_group *group)
539 {
540         struct dentry * dentry = dget(group->cg_item.ci_dentry);
541         struct dentry *child;
542         struct configfs_dirent *parent_sd;
543         struct configfs_dirent *sd, *tmp;
544
545         if (!dentry)
546                 return;
547
548         parent_sd = dentry->d_fsdata;
549         list_for_each_entry_safe(sd, tmp, &parent_sd->s_children, s_sibling) {
550                 if (!sd->s_element ||
551                     !(sd->s_type & CONFIGFS_USET_DEFAULT))
552                         continue;
553
554                 child = sd->s_dentry;
555
556                 /*
557                  * Note: we hide this from lockdep since we have no way
558                  * to teach lockdep about recursive
559                  * I_MUTEX_PARENT -> I_MUTEX_CHILD patterns along a path
560                  * in an inode tree, which are valid as soon as
561                  * I_MUTEX_PARENT -> I_MUTEX_CHILD is valid from a
562                  * parent inode to one of its children.
563                  */
564                 lockdep_off();
565                 mutex_lock(&child->d_inode->i_mutex);
566                 lockdep_on();
567
568                 configfs_detach_group(sd->s_element);
569                 child->d_inode->i_flags |= S_DEAD;
570
571                 lockdep_off();
572                 mutex_unlock(&child->d_inode->i_mutex);
573                 lockdep_on();
574
575                 d_delete(child);
576                 dput(child);
577         }
578
579         /**
580          * Drop reference from dget() on entrance.
581          */
582         dput(dentry);
583 }
584
585 /*
586  * This fakes mkdir(2) on a default_groups[] entry.  It
587  * creates a dentry, attachs it, and then does fixup
588  * on the sd->s_type.
589  *
590  * We could, perhaps, tweak our parent's ->mkdir for a minute and
591  * try using vfs_mkdir.  Just a thought.
592  */
593 static int create_default_group(struct config_group *parent_group,
594                                 struct config_group *group)
595 {
596         int ret;
597         struct qstr name;
598         struct configfs_dirent *sd;
599         /* We trust the caller holds a reference to parent */
600         struct dentry *child, *parent = parent_group->cg_item.ci_dentry;
601
602         if (!group->cg_item.ci_name)
603                 group->cg_item.ci_name = group->cg_item.ci_namebuf;
604         name.name = group->cg_item.ci_name;
605         name.len = strlen(name.name);
606         name.hash = full_name_hash(name.name, name.len);
607
608         ret = -ENOMEM;
609         child = d_alloc(parent, &name);
610         if (child) {
611                 d_add(child, NULL);
612
613                 ret = configfs_attach_group(&parent_group->cg_item,
614                                             &group->cg_item, child);
615                 if (!ret) {
616                         sd = child->d_fsdata;
617                         sd->s_type |= CONFIGFS_USET_DEFAULT;
618                 } else {
619                         d_delete(child);
620                         dput(child);
621                 }
622         }
623
624         return ret;
625 }
626
627 static int populate_groups(struct config_group *group)
628 {
629         struct config_group *new_group;
630         int ret = 0;
631         int i;
632
633         if (group->default_groups) {
634                 for (i = 0; group->default_groups[i]; i++) {
635                         new_group = group->default_groups[i];
636
637                         ret = create_default_group(group, new_group);
638                         if (ret) {
639                                 detach_groups(group);
640                                 break;
641                         }
642                 }
643         }
644
645         return ret;
646 }
647
648 /*
649  * All of link_obj/unlink_obj/link_group/unlink_group require that
650  * subsys->su_mutex is held.
651  */
652
653 static void unlink_obj(struct config_item *item)
654 {
655         struct config_group *group;
656
657         group = item->ci_group;
658         if (group) {
659                 list_del_init(&item->ci_entry);
660
661                 item->ci_group = NULL;
662                 item->ci_parent = NULL;
663
664                 /* Drop the reference for ci_entry */
665                 config_item_put(item);
666
667                 /* Drop the reference for ci_parent */
668                 config_group_put(group);
669         }
670 }
671
672 static void link_obj(struct config_item *parent_item, struct config_item *item)
673 {
674         /*
675          * Parent seems redundant with group, but it makes certain
676          * traversals much nicer.
677          */
678         item->ci_parent = parent_item;
679
680         /*
681          * We hold a reference on the parent for the child's ci_parent
682          * link.
683          */
684         item->ci_group = config_group_get(to_config_group(parent_item));
685         list_add_tail(&item->ci_entry, &item->ci_group->cg_children);
686
687         /*
688          * We hold a reference on the child for ci_entry on the parent's
689          * cg_children
690          */
691         config_item_get(item);
692 }
693
694 static void unlink_group(struct config_group *group)
695 {
696         int i;
697         struct config_group *new_group;
698
699         if (group->default_groups) {
700                 for (i = 0; group->default_groups[i]; i++) {
701                         new_group = group->default_groups[i];
702                         unlink_group(new_group);
703                 }
704         }
705
706         group->cg_subsys = NULL;
707         unlink_obj(&group->cg_item);
708 }
709
710 static void link_group(struct config_group *parent_group, struct config_group *group)
711 {
712         int i;
713         struct config_group *new_group;
714         struct configfs_subsystem *subsys = NULL; /* gcc is a turd */
715
716         link_obj(&parent_group->cg_item, &group->cg_item);
717
718         if (parent_group->cg_subsys)
719                 subsys = parent_group->cg_subsys;
720         else if (configfs_is_root(&parent_group->cg_item))
721                 subsys = to_configfs_subsystem(group);
722         else
723                 BUG();
724         group->cg_subsys = subsys;
725
726         if (group->default_groups) {
727                 for (i = 0; group->default_groups[i]; i++) {
728                         new_group = group->default_groups[i];
729                         link_group(group, new_group);
730                 }
731         }
732 }
733
734 /*
735  * The goal is that configfs_attach_item() (and
736  * configfs_attach_group()) can be called from either the VFS or this
737  * module.  That is, they assume that the items have been created,
738  * the dentry allocated, and the dcache is all ready to go.
739  *
740  * If they fail, they must clean up after themselves as if they
741  * had never been called.  The caller (VFS or local function) will
742  * handle cleaning up the dcache bits.
743  *
744  * configfs_detach_group() and configfs_detach_item() behave similarly on
745  * the way out.  They assume that the proper semaphores are held, they
746  * clean up the configfs items, and they expect their callers will
747  * handle the dcache bits.
748  */
749 static int configfs_attach_item(struct config_item *parent_item,
750                                 struct config_item *item,
751                                 struct dentry *dentry)
752 {
753         int ret;
754
755         ret = configfs_create_dir(item, dentry);
756         if (!ret) {
757                 ret = populate_attrs(item);
758                 if (ret) {
759                         /*
760                          * We are going to remove an inode and its dentry but
761                          * the VFS may already have hit and used them. Thus,
762                          * we must lock them as rmdir() would.
763                          *
764                          * Note: we hide this from lockdep since we have no way
765                          * to teach lockdep about recursive
766                          * I_MUTEX_PARENT -> I_MUTEX_CHILD patterns along a path
767                          * in an inode tree, which are valid as soon as
768                          * I_MUTEX_PARENT -> I_MUTEX_CHILD is valid from a
769                          * parent inode to one of its children.
770                          */
771                         lockdep_off();
772                         mutex_lock(&dentry->d_inode->i_mutex);
773                         lockdep_on();
774                         configfs_remove_dir(item);
775                         dentry->d_inode->i_flags |= S_DEAD;
776                         lockdep_off();
777                         mutex_unlock(&dentry->d_inode->i_mutex);
778                         lockdep_on();
779                         d_delete(dentry);
780                 }
781         }
782
783         return ret;
784 }
785
786 /* Caller holds the mutex of the item's inode */
787 static void configfs_detach_item(struct config_item *item)
788 {
789         detach_attrs(item);
790         configfs_remove_dir(item);
791 }
792
793 static int configfs_attach_group(struct config_item *parent_item,
794                                  struct config_item *item,
795                                  struct dentry *dentry)
796 {
797         int ret;
798         struct configfs_dirent *sd;
799
800         ret = configfs_attach_item(parent_item, item, dentry);
801         if (!ret) {
802                 sd = dentry->d_fsdata;
803                 sd->s_type |= CONFIGFS_USET_DIR;
804
805                 /*
806                  * FYI, we're faking mkdir in populate_groups()
807                  * We must lock the group's inode to avoid races with the VFS
808                  * which can already hit the inode and try to add/remove entries
809                  * under it.
810                  *
811                  * We must also lock the inode to remove it safely in case of
812                  * error, as rmdir() would.
813                  *
814                  * Note: we hide this from lockdep since we have no way
815                  * to teach lockdep about recursive
816                  * I_MUTEX_PARENT -> I_MUTEX_CHILD patterns along a path
817                  * in an inode tree, which are valid as soon as
818                  * I_MUTEX_PARENT -> I_MUTEX_CHILD is valid from a
819                  * parent inode to one of its children.
820                  */
821                 lockdep_off();
822                 mutex_lock_nested(&dentry->d_inode->i_mutex, I_MUTEX_CHILD);
823                 lockdep_on();
824                 ret = populate_groups(to_config_group(item));
825                 if (ret) {
826                         configfs_detach_item(item);
827                         dentry->d_inode->i_flags |= S_DEAD;
828                 }
829                 lockdep_off();
830                 mutex_unlock(&dentry->d_inode->i_mutex);
831                 lockdep_on();
832                 if (ret)
833                         d_delete(dentry);
834         }
835
836         return ret;
837 }
838
839 /* Caller holds the mutex of the group's inode */
840 static void configfs_detach_group(struct config_item *item)
841 {
842         detach_groups(to_config_group(item));
843         configfs_detach_item(item);
844 }
845
846 /*
847  * After the item has been detached from the filesystem view, we are
848  * ready to tear it out of the hierarchy.  Notify the client before
849  * we do that so they can perform any cleanup that requires
850  * navigating the hierarchy.  A client does not need to provide this
851  * callback.  The subsystem semaphore MUST be held by the caller, and
852  * references must be valid for both items.  It also assumes the
853  * caller has validated ci_type.
854  */
855 static void client_disconnect_notify(struct config_item *parent_item,
856                                      struct config_item *item)
857 {
858         struct config_item_type *type;
859
860         type = parent_item->ci_type;
861         BUG_ON(!type);
862
863         if (type->ct_group_ops && type->ct_group_ops->disconnect_notify)
864                 type->ct_group_ops->disconnect_notify(to_config_group(parent_item),
865                                                       item);
866 }
867
868 /*
869  * Drop the initial reference from make_item()/make_group()
870  * This function assumes that reference is held on item
871  * and that item holds a valid reference to the parent.  Also, it
872  * assumes the caller has validated ci_type.
873  */
874 static void client_drop_item(struct config_item *parent_item,
875                              struct config_item *item)
876 {
877         struct config_item_type *type;
878
879         type = parent_item->ci_type;
880         BUG_ON(!type);
881
882         /*
883          * If ->drop_item() exists, it is responsible for the
884          * config_item_put().
885          */
886         if (type->ct_group_ops && type->ct_group_ops->drop_item)
887                 type->ct_group_ops->drop_item(to_config_group(parent_item),
888                                               item);
889         else
890                 config_item_put(item);
891 }
892
893 #ifdef DEBUG
894 static void configfs_dump_one(struct configfs_dirent *sd, int level)
895 {
896         printk(KERN_INFO "%*s\"%s\":\n", level, " ", configfs_get_name(sd));
897
898 #define type_print(_type) if (sd->s_type & _type) printk(KERN_INFO "%*s %s\n", level, " ", #_type);
899         type_print(CONFIGFS_ROOT);
900         type_print(CONFIGFS_DIR);
901         type_print(CONFIGFS_ITEM_ATTR);
902         type_print(CONFIGFS_ITEM_LINK);
903         type_print(CONFIGFS_USET_DIR);
904         type_print(CONFIGFS_USET_DEFAULT);
905         type_print(CONFIGFS_USET_DROPPING);
906 #undef type_print
907 }
908
909 static int configfs_dump(struct configfs_dirent *sd, int level)
910 {
911         struct configfs_dirent *child_sd;
912         int ret = 0;
913
914         configfs_dump_one(sd, level);
915
916         if (!(sd->s_type & (CONFIGFS_DIR|CONFIGFS_ROOT)))
917                 return 0;
918
919         list_for_each_entry(child_sd, &sd->s_children, s_sibling) {
920                 ret = configfs_dump(child_sd, level + 2);
921                 if (ret)
922                         break;
923         }
924
925         return ret;
926 }
927 #endif
928
929
930 /*
931  * configfs_depend_item() and configfs_undepend_item()
932  *
933  * WARNING: Do not call these from a configfs callback!
934  *
935  * This describes these functions and their helpers.
936  *
937  * Allow another kernel system to depend on a config_item.  If this
938  * happens, the item cannot go away until the dependant can live without
939  * it.  The idea is to give client modules as simple an interface as
940  * possible.  When a system asks them to depend on an item, they just
941  * call configfs_depend_item().  If the item is live and the client
942  * driver is in good shape, we'll happily do the work for them.
943  *
944  * Why is the locking complex?  Because configfs uses the VFS to handle
945  * all locking, but this function is called outside the normal
946  * VFS->configfs path.  So it must take VFS locks to prevent the
947  * VFS->configfs stuff (configfs_mkdir(), configfs_rmdir(), etc).  This is
948  * why you can't call these functions underneath configfs callbacks.
949  *
950  * Note, btw, that this can be called at *any* time, even when a configfs
951  * subsystem isn't registered, or when configfs is loading or unloading.
952  * Just like configfs_register_subsystem().  So we take the same
953  * precautions.  We pin the filesystem.  We lock each i_mutex _in_order_
954  * on our way down the tree.  If we can find the target item in the
955  * configfs tree, it must be part of the subsystem tree as well, so we
956  * do not need the subsystem semaphore.  Holding the i_mutex chain locks
957  * out mkdir() and rmdir(), who might be racing us.
958  */
959
960 /*
961  * configfs_depend_prep()
962  *
963  * Only subdirectories count here.  Files (CONFIGFS_NOT_PINNED) are
964  * attributes.  This is similar but not the same to configfs_detach_prep().
965  * Note that configfs_detach_prep() expects the parent to be locked when it
966  * is called, but we lock the parent *inside* configfs_depend_prep().  We
967  * do that so we can unlock it if we find nothing.
968  *
969  * Here we do a depth-first search of the dentry hierarchy looking for
970  * our object.  We take i_mutex on each step of the way down.  IT IS
971  * ESSENTIAL THAT i_mutex LOCKING IS ORDERED.  If we come back up a branch,
972  * we'll drop the i_mutex.
973  *
974  * If the target is not found, -ENOENT is bubbled up and we have released
975  * all locks.  If the target was found, the locks will be cleared by
976  * configfs_depend_rollback().
977  *
978  * This adds a requirement that all config_items be unique!
979  *
980  * This is recursive because the locking traversal is tricky.  There isn't
981  * much on the stack, though, so folks that need this function - be careful
982  * about your stack!  Patches will be accepted to make it iterative.
983  */
984 static int configfs_depend_prep(struct dentry *origin,
985                                 struct config_item *target)
986 {
987         struct configfs_dirent *child_sd, *sd = origin->d_fsdata;
988         int ret = 0;
989
990         BUG_ON(!origin || !sd);
991
992         /* Lock this guy on the way down */
993         /*
994          * Note: we hide this from lockdep since we have no way
995          * to teach lockdep about recursive
996          * I_MUTEX_PARENT -> I_MUTEX_CHILD patterns along a path
997          * in an inode tree, which are valid as soon as
998          * I_MUTEX_PARENT -> I_MUTEX_CHILD is valid from a
999          * parent inode to one of its children.
1000          */
1001         lockdep_off();
1002         mutex_lock(&sd->s_dentry->d_inode->i_mutex);
1003         lockdep_on();
1004         if (sd->s_element == target)  /* Boo-yah */
1005                 goto out;
1006
1007         list_for_each_entry(child_sd, &sd->s_children, s_sibling) {
1008                 if (child_sd->s_type & CONFIGFS_DIR) {
1009                         ret = configfs_depend_prep(child_sd->s_dentry,
1010                                                    target);
1011                         if (!ret)
1012                                 goto out;  /* Child path boo-yah */
1013                 }
1014         }
1015
1016         /* We looped all our children and didn't find target */
1017         lockdep_off();
1018         mutex_unlock(&sd->s_dentry->d_inode->i_mutex);
1019         lockdep_on();
1020         ret = -ENOENT;
1021
1022 out:
1023         return ret;
1024 }
1025
1026 /*
1027  * This is ONLY called if configfs_depend_prep() did its job.  So we can
1028  * trust the entire path from item back up to origin.
1029  *
1030  * We walk backwards from item, unlocking each i_mutex.  We finish by
1031  * unlocking origin.
1032  */
1033 static void configfs_depend_rollback(struct dentry *origin,
1034                                      struct config_item *item)
1035 {
1036         struct dentry *dentry = item->ci_dentry;
1037
1038         while (dentry != origin) {
1039                 /* See comments in configfs_depend_prep() */
1040                 lockdep_off();
1041                 mutex_unlock(&dentry->d_inode->i_mutex);
1042                 lockdep_on();
1043                 dentry = dentry->d_parent;
1044         }
1045
1046         lockdep_off();
1047         mutex_unlock(&origin->d_inode->i_mutex);
1048         lockdep_on();
1049 }
1050
1051 int configfs_depend_item(struct configfs_subsystem *subsys,
1052                          struct config_item *target)
1053 {
1054         int ret;
1055         struct configfs_dirent *p, *root_sd, *subsys_sd = NULL;
1056         struct config_item *s_item = &subsys->su_group.cg_item;
1057
1058         /*
1059          * Pin the configfs filesystem.  This means we can safely access
1060          * the root of the configfs filesystem.
1061          */
1062         ret = configfs_pin_fs();
1063         if (ret)
1064                 return ret;
1065
1066         /*
1067          * Next, lock the root directory.  We're going to check that the
1068          * subsystem is really registered, and so we need to lock out
1069          * configfs_[un]register_subsystem().
1070          */
1071         mutex_lock(&configfs_sb->s_root->d_inode->i_mutex);
1072
1073         root_sd = configfs_sb->s_root->d_fsdata;
1074
1075         list_for_each_entry(p, &root_sd->s_children, s_sibling) {
1076                 if (p->s_type & CONFIGFS_DIR) {
1077                         if (p->s_element == s_item) {
1078                                 subsys_sd = p;
1079                                 break;
1080                         }
1081                 }
1082         }
1083
1084         if (!subsys_sd) {
1085                 ret = -ENOENT;
1086                 goto out_unlock_fs;
1087         }
1088
1089         /* Ok, now we can trust subsys/s_item */
1090
1091         /* Scan the tree, locking i_mutex recursively, return 0 if found */
1092         ret = configfs_depend_prep(subsys_sd->s_dentry, target);
1093         if (ret)
1094                 goto out_unlock_fs;
1095
1096         /* We hold all i_mutexes from the subsystem down to the target */
1097         p = target->ci_dentry->d_fsdata;
1098         p->s_dependent_count += 1;
1099
1100         configfs_depend_rollback(subsys_sd->s_dentry, target);
1101
1102 out_unlock_fs:
1103         mutex_unlock(&configfs_sb->s_root->d_inode->i_mutex);
1104
1105         /*
1106          * If we succeeded, the fs is pinned via other methods.  If not,
1107          * we're done with it anyway.  So release_fs() is always right.
1108          */
1109         configfs_release_fs();
1110
1111         return ret;
1112 }
1113 EXPORT_SYMBOL(configfs_depend_item);
1114
1115 /*
1116  * Release the dependent linkage.  This is much simpler than
1117  * configfs_depend_item() because we know that that the client driver is
1118  * pinned, thus the subsystem is pinned, and therefore configfs is pinned.
1119  */
1120 void configfs_undepend_item(struct configfs_subsystem *subsys,
1121                             struct config_item *target)
1122 {
1123         struct configfs_dirent *sd;
1124
1125         /*
1126          * Since we can trust everything is pinned, we just need i_mutex
1127          * on the item.
1128          */
1129         mutex_lock(&target->ci_dentry->d_inode->i_mutex);
1130
1131         sd = target->ci_dentry->d_fsdata;
1132         BUG_ON(sd->s_dependent_count < 1);
1133
1134         sd->s_dependent_count -= 1;
1135
1136         /*
1137          * After this unlock, we cannot trust the item to stay alive!
1138          * DO NOT REFERENCE item after this unlock.
1139          */
1140         mutex_unlock(&target->ci_dentry->d_inode->i_mutex);
1141 }
1142 EXPORT_SYMBOL(configfs_undepend_item);
1143
1144 static int configfs_mkdir(struct inode *dir, struct dentry *dentry, int mode)
1145 {
1146         int ret = 0;
1147         int module_got = 0;
1148         struct config_group *group = NULL;
1149         struct config_item *item = NULL;
1150         struct config_item *parent_item;
1151         struct configfs_subsystem *subsys;
1152         struct configfs_dirent *sd;
1153         struct config_item_type *type;
1154         struct module *subsys_owner = NULL, *new_item_owner = NULL;
1155         char *name;
1156
1157         if (dentry->d_parent == configfs_sb->s_root) {
1158                 ret = -EPERM;
1159                 goto out;
1160         }
1161
1162         sd = dentry->d_parent->d_fsdata;
1163
1164         /*
1165          * Fake invisibility if dir belongs to a group/default groups hierarchy
1166          * being attached
1167          */
1168         if (!configfs_dirent_is_ready(sd)) {
1169                 ret = -ENOENT;
1170                 goto out;
1171         }
1172
1173         if (!(sd->s_type & CONFIGFS_USET_DIR)) {
1174                 ret = -EPERM;
1175                 goto out;
1176         }
1177
1178         /* Get a working ref for the duration of this function */
1179         parent_item = configfs_get_config_item(dentry->d_parent);
1180         type = parent_item->ci_type;
1181         subsys = to_config_group(parent_item)->cg_subsys;
1182         BUG_ON(!subsys);
1183
1184         if (!type || !type->ct_group_ops ||
1185             (!type->ct_group_ops->make_group &&
1186              !type->ct_group_ops->make_item)) {
1187                 ret = -EPERM;  /* Lack-of-mkdir returns -EPERM */
1188                 goto out_put;
1189         }
1190
1191         /*
1192          * The subsystem may belong to a different module than the item
1193          * being created.  We don't want to safely pin the new item but
1194          * fail to pin the subsystem it sits under.
1195          */
1196         if (!subsys->su_group.cg_item.ci_type) {
1197                 ret = -EINVAL;
1198                 goto out_put;
1199         }
1200         subsys_owner = subsys->su_group.cg_item.ci_type->ct_owner;
1201         if (!try_module_get(subsys_owner)) {
1202                 ret = -EINVAL;
1203                 goto out_put;
1204         }
1205
1206         name = kmalloc(dentry->d_name.len + 1, GFP_KERNEL);
1207         if (!name) {
1208                 ret = -ENOMEM;
1209                 goto out_subsys_put;
1210         }
1211
1212         snprintf(name, dentry->d_name.len + 1, "%s", dentry->d_name.name);
1213
1214         mutex_lock(&subsys->su_mutex);
1215         if (type->ct_group_ops->make_group) {
1216                 group = type->ct_group_ops->make_group(to_config_group(parent_item), name);
1217                 if (!group)
1218                         group = ERR_PTR(-ENOMEM);
1219                 if (!IS_ERR(group)) {
1220                         link_group(to_config_group(parent_item), group);
1221                         item = &group->cg_item;
1222                 } else
1223                         ret = PTR_ERR(group);
1224         } else {
1225                 item = type->ct_group_ops->make_item(to_config_group(parent_item), name);
1226                 if (!item)
1227                         item = ERR_PTR(-ENOMEM);
1228                 if (!IS_ERR(item))
1229                         link_obj(parent_item, item);
1230                 else
1231                         ret = PTR_ERR(item);
1232         }
1233         mutex_unlock(&subsys->su_mutex);
1234
1235         kfree(name);
1236         if (ret) {
1237                 /*
1238                  * If ret != 0, then link_obj() was never called.
1239                  * There are no extra references to clean up.
1240                  */
1241                 goto out_subsys_put;
1242         }
1243
1244         /*
1245          * link_obj() has been called (via link_group() for groups).
1246          * From here on out, errors must clean that up.
1247          */
1248
1249         type = item->ci_type;
1250         if (!type) {
1251                 ret = -EINVAL;
1252                 goto out_unlink;
1253         }
1254
1255         new_item_owner = type->ct_owner;
1256         if (!try_module_get(new_item_owner)) {
1257                 ret = -EINVAL;
1258                 goto out_unlink;
1259         }
1260
1261         /*
1262          * I hate doing it this way, but if there is
1263          * an error,  module_put() probably should
1264          * happen after any cleanup.
1265          */
1266         module_got = 1;
1267
1268         /*
1269          * Make racing rmdir() fail if it did not tag parent with
1270          * CONFIGFS_USET_DROPPING
1271          * Note: if CONFIGFS_USET_DROPPING is already set, attach_group() will
1272          * fail and let rmdir() terminate correctly
1273          */
1274         spin_lock(&configfs_dirent_lock);
1275         /* This will make configfs_detach_prep() fail */
1276         sd->s_type |= CONFIGFS_USET_IN_MKDIR;
1277         spin_unlock(&configfs_dirent_lock);
1278
1279         if (group)
1280                 ret = configfs_attach_group(parent_item, item, dentry);
1281         else
1282                 ret = configfs_attach_item(parent_item, item, dentry);
1283
1284         spin_lock(&configfs_dirent_lock);
1285         sd->s_type &= ~CONFIGFS_USET_IN_MKDIR;
1286         if (!ret)
1287                 configfs_dir_set_ready(dentry->d_fsdata);
1288         spin_unlock(&configfs_dirent_lock);
1289
1290 out_unlink:
1291         if (ret) {
1292                 /* Tear down everything we built up */
1293                 mutex_lock(&subsys->su_mutex);
1294
1295                 client_disconnect_notify(parent_item, item);
1296                 if (group)
1297                         unlink_group(group);
1298                 else
1299                         unlink_obj(item);
1300                 client_drop_item(parent_item, item);
1301
1302                 mutex_unlock(&subsys->su_mutex);
1303
1304                 if (module_got)
1305                         module_put(new_item_owner);
1306         }
1307
1308 out_subsys_put:
1309         if (ret)
1310                 module_put(subsys_owner);
1311
1312 out_put:
1313         /*
1314          * link_obj()/link_group() took a reference from child->parent,
1315          * so the parent is safely pinned.  We can drop our working
1316          * reference.
1317          */
1318         config_item_put(parent_item);
1319
1320 out:
1321         return ret;
1322 }
1323
1324 static int configfs_rmdir(struct inode *dir, struct dentry *dentry)
1325 {
1326         struct config_item *parent_item;
1327         struct config_item *item;
1328         struct configfs_subsystem *subsys;
1329         struct configfs_dirent *sd;
1330         struct module *subsys_owner = NULL, *dead_item_owner = NULL;
1331         int ret;
1332
1333         if (dentry->d_parent == configfs_sb->s_root)
1334                 return -EPERM;
1335
1336         sd = dentry->d_fsdata;
1337         if (sd->s_type & CONFIGFS_USET_DEFAULT)
1338                 return -EPERM;
1339
1340         /*
1341          * Here's where we check for dependents.  We're protected by
1342          * i_mutex.
1343          */
1344         if (sd->s_dependent_count)
1345                 return -EBUSY;
1346
1347         /* Get a working ref until we have the child */
1348         parent_item = configfs_get_config_item(dentry->d_parent);
1349         subsys = to_config_group(parent_item)->cg_subsys;
1350         BUG_ON(!subsys);
1351
1352         if (!parent_item->ci_type) {
1353                 config_item_put(parent_item);
1354                 return -EINVAL;
1355         }
1356
1357         /* configfs_mkdir() shouldn't have allowed this */
1358         BUG_ON(!subsys->su_group.cg_item.ci_type);
1359         subsys_owner = subsys->su_group.cg_item.ci_type->ct_owner;
1360
1361         /*
1362          * Ensure that no racing symlink() will make detach_prep() fail while
1363          * the new link is temporarily attached
1364          */
1365         do {
1366                 struct mutex *wait_mutex;
1367
1368                 mutex_lock(&configfs_symlink_mutex);
1369                 spin_lock(&configfs_dirent_lock);
1370                 ret = configfs_detach_prep(dentry, &wait_mutex);
1371                 if (ret)
1372                         configfs_detach_rollback(dentry);
1373                 spin_unlock(&configfs_dirent_lock);
1374                 mutex_unlock(&configfs_symlink_mutex);
1375
1376                 if (ret) {
1377                         if (ret != -EAGAIN) {
1378                                 config_item_put(parent_item);
1379                                 return ret;
1380                         }
1381
1382                         /* Wait until the racing operation terminates */
1383                         /*
1384                          * Note: we hide this from lockdep since we are locked
1385                          * with subclass I_MUTEX_NORMAL from vfs_rmdir() (why
1386                          * not I_MUTEX_CHILD?), and I_MUTEX_XATTR or
1387                          * I_MUTEX_QUOTA are not relevant for the locked inode.
1388                          */
1389                         lockdep_off();
1390                         mutex_lock(wait_mutex);
1391                         mutex_unlock(wait_mutex);
1392                         lockdep_on();
1393                 }
1394         } while (ret == -EAGAIN);
1395
1396         /* Get a working ref for the duration of this function */
1397         item = configfs_get_config_item(dentry);
1398
1399         /* Drop reference from above, item already holds one. */
1400         config_item_put(parent_item);
1401
1402         if (item->ci_type)
1403                 dead_item_owner = item->ci_type->ct_owner;
1404
1405         if (sd->s_type & CONFIGFS_USET_DIR) {
1406                 configfs_detach_group(item);
1407
1408                 mutex_lock(&subsys->su_mutex);
1409                 client_disconnect_notify(parent_item, item);
1410                 unlink_group(to_config_group(item));
1411         } else {
1412                 configfs_detach_item(item);
1413
1414                 mutex_lock(&subsys->su_mutex);
1415                 client_disconnect_notify(parent_item, item);
1416                 unlink_obj(item);
1417         }
1418
1419         client_drop_item(parent_item, item);
1420         mutex_unlock(&subsys->su_mutex);
1421
1422         /* Drop our reference from above */
1423         config_item_put(item);
1424
1425         module_put(dead_item_owner);
1426         module_put(subsys_owner);
1427
1428         return 0;
1429 }
1430
1431 const struct inode_operations configfs_dir_inode_operations = {
1432         .mkdir          = configfs_mkdir,
1433         .rmdir          = configfs_rmdir,
1434         .symlink        = configfs_symlink,
1435         .unlink         = configfs_unlink,
1436         .lookup         = configfs_lookup,
1437         .setattr        = configfs_setattr,
1438 };
1439
1440 #if 0
1441 int configfs_rename_dir(struct config_item * item, const char *new_name)
1442 {
1443         int error = 0;
1444         struct dentry * new_dentry, * parent;
1445
1446         if (!strcmp(config_item_name(item), new_name))
1447                 return -EINVAL;
1448
1449         if (!item->parent)
1450                 return -EINVAL;
1451
1452         down_write(&configfs_rename_sem);
1453         parent = item->parent->dentry;
1454
1455         mutex_lock(&parent->d_inode->i_mutex);
1456
1457         new_dentry = lookup_one_len(new_name, parent, strlen(new_name));
1458         if (!IS_ERR(new_dentry)) {
1459                 if (!new_dentry->d_inode) {
1460                         error = config_item_set_name(item, "%s", new_name);
1461                         if (!error) {
1462                                 d_add(new_dentry, NULL);
1463                                 d_move(item->dentry, new_dentry);
1464                         }
1465                         else
1466                                 d_delete(new_dentry);
1467                 } else
1468                         error = -EEXIST;
1469                 dput(new_dentry);
1470         }
1471         mutex_unlock(&parent->d_inode->i_mutex);
1472         up_write(&configfs_rename_sem);
1473
1474         return error;
1475 }
1476 #endif
1477
1478 static int configfs_dir_open(struct inode *inode, struct file *file)
1479 {
1480         struct dentry * dentry = file->f_path.dentry;
1481         struct configfs_dirent * parent_sd = dentry->d_fsdata;
1482         int err;
1483
1484         mutex_lock(&dentry->d_inode->i_mutex);
1485         /*
1486          * Fake invisibility if dir belongs to a group/default groups hierarchy
1487          * being attached
1488          */
1489         err = -ENOENT;
1490         if (configfs_dirent_is_ready(parent_sd)) {
1491                 file->private_data = configfs_new_dirent(parent_sd, NULL);
1492                 if (IS_ERR(file->private_data))
1493                         err = PTR_ERR(file->private_data);
1494                 else
1495                         err = 0;
1496         }
1497         mutex_unlock(&dentry->d_inode->i_mutex);
1498
1499         return err;
1500 }
1501
1502 static int configfs_dir_close(struct inode *inode, struct file *file)
1503 {
1504         struct dentry * dentry = file->f_path.dentry;
1505         struct configfs_dirent * cursor = file->private_data;
1506
1507         mutex_lock(&dentry->d_inode->i_mutex);
1508         spin_lock(&configfs_dirent_lock);
1509         list_del_init(&cursor->s_sibling);
1510         spin_unlock(&configfs_dirent_lock);
1511         mutex_unlock(&dentry->d_inode->i_mutex);
1512
1513         release_configfs_dirent(cursor);
1514
1515         return 0;
1516 }
1517
1518 /* Relationship between s_mode and the DT_xxx types */
1519 static inline unsigned char dt_type(struct configfs_dirent *sd)
1520 {
1521         return (sd->s_mode >> 12) & 15;
1522 }
1523
1524 static int configfs_readdir(struct file * filp, void * dirent, filldir_t filldir)
1525 {
1526         struct dentry *dentry = filp->f_path.dentry;
1527         struct configfs_dirent * parent_sd = dentry->d_fsdata;
1528         struct configfs_dirent *cursor = filp->private_data;
1529         struct list_head *p, *q = &cursor->s_sibling;
1530         ino_t ino;
1531         int i = filp->f_pos;
1532
1533         switch (i) {
1534                 case 0:
1535                         ino = dentry->d_inode->i_ino;
1536                         if (filldir(dirent, ".", 1, i, ino, DT_DIR) < 0)
1537                                 break;
1538                         filp->f_pos++;
1539                         i++;
1540                         /* fallthrough */
1541                 case 1:
1542                         ino = parent_ino(dentry);
1543                         if (filldir(dirent, "..", 2, i, ino, DT_DIR) < 0)
1544                                 break;
1545                         filp->f_pos++;
1546                         i++;
1547                         /* fallthrough */
1548                 default:
1549                         if (filp->f_pos == 2) {
1550                                 spin_lock(&configfs_dirent_lock);
1551                                 list_move(q, &parent_sd->s_children);
1552                                 spin_unlock(&configfs_dirent_lock);
1553                         }
1554                         for (p=q->next; p!= &parent_sd->s_children; p=p->next) {
1555                                 struct configfs_dirent *next;
1556                                 const char * name;
1557                                 int len;
1558
1559                                 next = list_entry(p, struct configfs_dirent,
1560                                                    s_sibling);
1561                                 if (!next->s_element)
1562                                         continue;
1563
1564                                 name = configfs_get_name(next);
1565                                 len = strlen(name);
1566                                 if (next->s_dentry)
1567                                         ino = next->s_dentry->d_inode->i_ino;
1568                                 else
1569                                         ino = iunique(configfs_sb, 2);
1570
1571                                 if (filldir(dirent, name, len, filp->f_pos, ino,
1572                                                  dt_type(next)) < 0)
1573                                         return 0;
1574
1575                                 spin_lock(&configfs_dirent_lock);
1576                                 list_move(q, p);
1577                                 spin_unlock(&configfs_dirent_lock);
1578                                 p = q;
1579                                 filp->f_pos++;
1580                         }
1581         }
1582         return 0;
1583 }
1584
1585 static loff_t configfs_dir_lseek(struct file * file, loff_t offset, int origin)
1586 {
1587         struct dentry * dentry = file->f_path.dentry;
1588
1589         mutex_lock(&dentry->d_inode->i_mutex);
1590         switch (origin) {
1591                 case 1:
1592                         offset += file->f_pos;
1593                 case 0:
1594                         if (offset >= 0)
1595                                 break;
1596                 default:
1597                         mutex_unlock(&file->f_path.dentry->d_inode->i_mutex);
1598                         return -EINVAL;
1599         }
1600         if (offset != file->f_pos) {
1601                 file->f_pos = offset;
1602                 if (file->f_pos >= 2) {
1603                         struct configfs_dirent *sd = dentry->d_fsdata;
1604                         struct configfs_dirent *cursor = file->private_data;
1605                         struct list_head *p;
1606                         loff_t n = file->f_pos - 2;
1607
1608                         spin_lock(&configfs_dirent_lock);
1609                         list_del(&cursor->s_sibling);
1610                         p = sd->s_children.next;
1611                         while (n && p != &sd->s_children) {
1612                                 struct configfs_dirent *next;
1613                                 next = list_entry(p, struct configfs_dirent,
1614                                                    s_sibling);
1615                                 if (next->s_element)
1616                                         n--;
1617                                 p = p->next;
1618                         }
1619                         list_add_tail(&cursor->s_sibling, p);
1620                         spin_unlock(&configfs_dirent_lock);
1621                 }
1622         }
1623         mutex_unlock(&dentry->d_inode->i_mutex);
1624         return offset;
1625 }
1626
1627 const struct file_operations configfs_dir_operations = {
1628         .open           = configfs_dir_open,
1629         .release        = configfs_dir_close,
1630         .llseek         = configfs_dir_lseek,
1631         .read           = generic_read_dir,
1632         .readdir        = configfs_readdir,
1633 };
1634
1635 int configfs_register_subsystem(struct configfs_subsystem *subsys)
1636 {
1637         int err;
1638         struct config_group *group = &subsys->su_group;
1639         struct qstr name;
1640         struct dentry *dentry;
1641         struct configfs_dirent *sd;
1642
1643         err = configfs_pin_fs();
1644         if (err)
1645                 return err;
1646
1647         if (!group->cg_item.ci_name)
1648                 group->cg_item.ci_name = group->cg_item.ci_namebuf;
1649
1650         sd = configfs_sb->s_root->d_fsdata;
1651         link_group(to_config_group(sd->s_element), group);
1652
1653         mutex_lock_nested(&configfs_sb->s_root->d_inode->i_mutex,
1654                         I_MUTEX_PARENT);
1655
1656         name.name = group->cg_item.ci_name;
1657         name.len = strlen(name.name);
1658         name.hash = full_name_hash(name.name, name.len);
1659
1660         err = -ENOMEM;
1661         dentry = d_alloc(configfs_sb->s_root, &name);
1662         if (dentry) {
1663                 d_add(dentry, NULL);
1664
1665                 err = configfs_attach_group(sd->s_element, &group->cg_item,
1666                                             dentry);
1667                 if (err) {
1668                         d_delete(dentry);
1669                         dput(dentry);
1670                 } else {
1671                         spin_lock(&configfs_dirent_lock);
1672                         configfs_dir_set_ready(dentry->d_fsdata);
1673                         spin_unlock(&configfs_dirent_lock);
1674                 }
1675         }
1676
1677         mutex_unlock(&configfs_sb->s_root->d_inode->i_mutex);
1678
1679         if (err) {
1680                 unlink_group(group);
1681                 configfs_release_fs();
1682         }
1683
1684         return err;
1685 }
1686
1687 void configfs_unregister_subsystem(struct configfs_subsystem *subsys)
1688 {
1689         struct config_group *group = &subsys->su_group;
1690         struct dentry *dentry = group->cg_item.ci_dentry;
1691
1692         if (dentry->d_parent != configfs_sb->s_root) {
1693                 printk(KERN_ERR "configfs: Tried to unregister non-subsystem!\n");
1694                 return;
1695         }
1696
1697         mutex_lock_nested(&configfs_sb->s_root->d_inode->i_mutex,
1698                           I_MUTEX_PARENT);
1699         mutex_lock_nested(&dentry->d_inode->i_mutex, I_MUTEX_CHILD);
1700         mutex_lock(&configfs_symlink_mutex);
1701         spin_lock(&configfs_dirent_lock);
1702         if (configfs_detach_prep(dentry, NULL)) {
1703                 printk(KERN_ERR "configfs: Tried to unregister non-empty subsystem!\n");
1704         }
1705         spin_unlock(&configfs_dirent_lock);
1706         mutex_unlock(&configfs_symlink_mutex);
1707         configfs_detach_group(&group->cg_item);
1708         dentry->d_inode->i_flags |= S_DEAD;
1709         mutex_unlock(&dentry->d_inode->i_mutex);
1710
1711         d_delete(dentry);
1712
1713         mutex_unlock(&configfs_sb->s_root->d_inode->i_mutex);
1714
1715         dput(dentry);
1716
1717         unlink_group(group);
1718         configfs_release_fs();
1719 }
1720
1721 EXPORT_SYMBOL(configfs_register_subsystem);
1722 EXPORT_SYMBOL(configfs_unregister_subsystem);