[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [linux_var] PATCH KERNEL LINUX

To: talking@ml.linuxvar.it
Subject: Re: [linux_var] PATCH KERNEL LINUX
From: Wall-T <wdicarlo@gmail.com>
Date: Fri, 8 Apr 2011 10:41:16 +0200
Dkim-signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=gmail.com; s=gamma; h=domainkey-signature:mime-version:in-reply-to:references:from:date :message-id:subject:to:content-type:content-transfer-encoding; bh=bXyEpcIZ+CsCnGUyU6S38jwXIV2hlok7/YJLH2C2kks=; b=uw/QjJQD6QDnuzekT3UBHVtCtzeYp/xCG0Pt99MjhFqWoiqza4XTbgYxp/8NeI1Cp3 xjT0SBepvC3Y8YbcTYO3edAd4jTmc3at683l9dh2g3WbaLehA9UpdmxO8qwIUzBdrU6r B4qprXoF3nWKnxUk/or2AWip83U5zniWdeQls=
Domainkey-signature: a=rsa-sha1; c=nofws; d=gmail.com; s=gamma; h=mime-version:in-reply-to:references:from:date:message-id:subject:to :content-type:content-transfer-encoding; b=AVLcwiDuEBtl1NKyqMUxBHItEXLcngq9HkonXNH7mjkFLUwx6apdpTj+fktMfP/UFX nzbcRP9X7nZgw9usFtGfKxy+zTuVusXxjS+tyq4xvAA9xeldprRTPXVsjj/kNA/NWWHh Ar7uj0jdMb+St5Q4zdFFLTj0M72UlW/G2JHFM=
In-reply-to: <BANLkTikNbM5bDD01BgG9O4PXPWtDDfC=dw@mail.gmail.com>
List-archive: <http://ml.linuxvar.it/wws/arc/talking>
List-help: <mailto:sympa@ml.linuxvar.it?subject=help>
List-id: <talking.ml.linuxvar.it>
List-owner: <mailto:talking-request@ml.linuxvar.it>
List-post: <mailto:talking@ml.linuxvar.it>
List-subscribe: <mailto:sympa@ml.linuxvar.it?subject=subscribe%20talking>
List-unsubscribe: <mailto:sympa@ml.linuxvar.it?subject=unsubscribe%20talking>
References: <BANLkTinhCe-4J_Vo=pRA=3O5MeODCzeGCQ@mail.gmail.com> <BANLkTikqL9ZmTSG_CHSOggb4gUvM5Q8QRA@mail.gmail.com> <BANLkTik2CJvT61zCY0DAHEbM0FBA1SEdtQ@mail.gmail.com> <BANLkTi=2HRi2ExKL-b3u9kciJ7FVm9pSng@mail.gmail.com> <20110406125624.GC21926@tiscali.it> <BANLkTikNbM5bDD01BgG9O4PXPWtDDfC=dw@mail.gmail.com>
Reply-to: talking@ml.linuxvar.it

Prima di passare allo sviluppo, non e' meglio valutare altri filesystems?

http://serverfault.com/questions/6711/filesystem-for-millions-of-small-files


Ciao
Walter

2011/4/8 Giovanni Orlandi <orlangio@gmail.com>:
> scusate, secondo voi posso partire da questo articolo o è troppo vecchio
>
> http://tldp.org/HOWTO/html_single/Implement-Sys-Call-Linux-2.6-i386/
> Gio
> Il giorno 06 aprile 2011 14:56, Diego Roversi <diegor@tiscali.it> ha
> scritto:
>>
>> On Mon, Apr 04, 2011 at 04:22:46PM +0200, Giovanni Orlandi wrote:
>>
>> > Banalmente sono la cancellazione diretta di una directory con milioni di
>> > files,
>> > adesso sto lavorando con dischi in RAID di diversi TERA e capita che
>> > alcune
>> > directory si "riempiano" di milioni di FILE
>> > poi per cancellare il tutto con il classico "rm -r" occorrono *ALCUNI
>> > GIORNI *nonostante dei server Dual Xeon che
>> > vantano 24 processori (12 core * 2 con hypertrading)
>> > E naturalmente in quel lasso di tempo il server diventa inservibile con
>> > iostat al 100% sul disco in questione.
>>
>> Il problema di base e' che una directory e' una struttura sequenziale, per
>> cui c'e' il rischio che per cancellare un file, si deve scandire tutta la
>> directory per trovare il file da cancellare. In realta' ci sono gia' una
>> serie di "ottimizzazioni" che vengono fatte dal kernel per evitare il
>> problema (vedi opzione dir_index per ext3 e ext4), ma credo che con questi
>> numeri diventa' un paliativo. Non solo sempre ext2 e successivi, cerca di
>> allocare i file di una stessa directory nello stesso gruppo, in modo da
>> ridurre i seek time per passare da un file al successivo, ma se il 99.9%
>> dei
>> file sta nella stessa cartella, non e' in grado di farlo.
>>
>> Di solito, dato che e' un problema abbastanza noto, la soluzione canonica
>> e' di
>> sfruttare il fatto che e' possibile creare una struttura ad albero di
>> directory innestate. E poi si usa un sistema di hashing per decidere in
>> che
>> cartella mettere i file.
>>
>> Esempio banale, mettiamo che i file sono tutti numerati: foo000001.txt,
>> foo000002.txt e cosi' via. A questo punto si puo' creare un alberatura di
>> questo tipo:
>>
>> cartella-+0000-00
>>         |    +01
>>         |    +02
>>         .    ...
>>         +0100-00
>>              +01
>>              +02
>>
>>
>> E il file foo123456.txt verra' sempre salvato nella sottocartella 1200/34.
>> In questo modo le singole directory rimangono piu' compatte e non c'e' il
>> rischio che si sparpaglino in giro.
>>
>> In verita' l'approccio canonico era del tipo
>> cartella/12/34/file123456.txt,
>> ho messo 1200 nella speranza che fosse piu' chiara ^^
>>
>> Questo tipo di approccio era particolarmente popolare agli albori di unix,
>> quando le directory non erano indicizzate, ma ancora adesso sembra dare un
>> buon speedup, rispetto all'unica cartella con milioni di file.
>>
>> Ovviamente quanti file mettere in ciascuna cartella dipende dal sistema,
>> ma
>> di solito i numeri sono nell'ordine di alcune centinaia per cartella. Al
>> limite mille.
>>
>> Saluti,
>>  Diego Roversi.
>>
>> --
>> Per cancellare l'iscrizione: <talking-unsubscribe at ml.linuxvar.it>
>> Archivi web e configurazione: http://ml.linuxvar.it/ml/
>
>
>
> --
> -----------------------------------------------------------------------------------------
> Luca 18,5 : "Poiché questa vedova è così molesta le farò giustizia, perché
> non venga continuamente a importunarmi".
> Neemia 8,10 : "...questo giorno è consacrato al nostro Signore; non siate
> tristi; perché la gioia del Signore è la vostra forza".
> GSM 345.6050488 / 327.0547392 / 392.0698126 - Fax 06.62204735
>

-- 
Per cancellare l'iscrizione: <talking-unsubscribe at ml.linuxvar.it>
Archivi web e configurazione: http://ml.linuxvar.it/ml/

Follow-Ups:
- Re: [linux_var] PATCH KERNEL LINUX
  - From: Giovanni Orlandi <orlangio@gmail.com>

References:
- [linux_var] PATCH KERNEL LINUX
  - From: Giovanni Orlandi <orlangio@gmail.com>
- Re: [linux_var] PATCH KERNEL LINUX
  - From: Lorenzo Lobba <lorenzo.lobba@gmail.com>
- Re: [linux_var] PATCH KERNEL LINUX
  - From: "Mr. P|pex" <gianluca@pipex.name>
- Re: [linux_var] PATCH KERNEL LINUX
  - From: Giovanni Orlandi <orlangio@gmail.com>
- Re: [linux_var] PATCH KERNEL LINUX
  - From: Diego Roversi <diegor@tiscali.it>
- Re: [linux_var] PATCH KERNEL LINUX
  - From: Giovanni Orlandi <orlangio@gmail.com>

Prev by Date: Re: [linux_var] PATCH KERNEL LINUX
Next by Date: Re: [linux_var] PATCH KERNEL LINUX
Previous by thread: Re: [linux_var] PATCH KERNEL LINUX
Next by thread: Re: [linux_var] PATCH KERNEL LINUX
Index(es):
- Date
- Thread