Souborový systém
Z Multimediaexpo.cz
Souborový systém (anglicky file system) je v informatice označení pro způsob organizace dat ve formě souborů (a většinou i adresářů) tak, aby k nim bylo možné snadno přistupovat. Souborové systémy jsou uloženy na vhodném typu elektronické paměti, která je umístěna přímo v počítači (pevný disk nebo CD…) nebo může být zpřístupněna pomocí počítačové sítě (NFS, SMB, AppleTalk…).
Obsah |
Účel souborového systému
Údaje v elektronické paměti jsou přístupné v podstatě jako vektor dvojkových čísel. Přitom různé oblasti tohoto vektoru mohou být v závislosti na typu a okamžitém stavu paměti různě rychle dostupné. Například harddisk nebo CD-mechanika potřebuje určitý čas na přesun hlavičky na jinou stopu a než se pod hlavičku dostane oblast s požadovanými daty. Souborový systém zajišťuje ukládání a čtení dat paměťového média tak, aby s nimi uživatelé mohli pracovat ve formě souborů a adresářů. Základní ideou souborového systému je tedy zpřístupnění a ukládání dat pomocí hierarchicky organizovaného systému adresářů a souborů. Představme si rozsáhlou knihovnu dokumentů, kde bychom mohli popsat přístup ke konkrétnímu dokumentu například následovně: "budova C/2. patro/místnost č. 12/regál 3/šuplík D2/Šanon Akta-X/Dokument Vetřelec". V analogické abstraktní formě zpřístupňuje informace souborový systém, až na to že místo "budovy" nejsíše budeme mít písmeno označující logický disk, místo "patra" adresář 1. hierarchické úrovně, místo "místnosti" podadresář, dále podpodadresář, atp. Jednotlivým dokumentům v šanonech by pak odpovídaly soubory. Základním pravidlem každého souborového systému je, že data musí být jednoznačně určena svým jménem. Z toho vyplývá, že dva soubory nebo podadresáře umístěné ve stejném adresáři nesmí mít stejné jméno. Jednoúčelová zařízení jako jsou mp3 přehrávače nebo digitální fotoaparáty mohou podporovat pouze omezenou podmnožinu funkcí souborového systému. Avšak s plnohodnotnými hierarchickými souborovými systémy se setkáváme stále častěji (například v mobilních telefonech). Souborový systém zaznamenává kromě jména souboru a jeho umístění v hierarchii adresářů další informace sloužící pro správu souborů. Především jsou to časové známky (nejdůležitější je čas poslední změny). Dále může souborový systém vést informace o vlastnících souborů a přístupových právech, což je důležité ve víceuživatelských systémech, nebo při zpřístupňování dat na disku pomocí počítačové sítě.
Organizace dat na disku
Pevné disky jsou obvykle logicky rozděleny na oddíly (partition), takže souborový systém se rozkládá jen na konkrétním oddílu a ne na celém disku. To umožňuje mít na pevném disku více nezávislých souborových systémů, které mohou být různého typu. Informace uložené v systému souborů dělíme na metadata a data. Metadata popisují strukturu systému souborů a nesou další služební a doplňující informace, jako je velikost souboru, čas poslední změny souboru, čas posledního přístupu k souboru, vlastník souboru, oprávnění v systému souborů, seznam bloků dat, které tvoří vlastní soubor atd. Pojmem data pak míníme vlastní obsah souboru, který můžeme přečíst, když soubor otevřeme. Software, který realizuje souborový systém, bývá obvykle součástí operačního systému. Většina operačních systémů podporuje několik různých souborových systémů. V Microsoft Windows nalezneme podporu pro souborové systémy FAT a NTFS a ISO 9660 pro ukládání souborů na CD a DVD. V Linuxu nalezneme kromě již zmíněných také ext2, ext3, ext4, ReiserFS, JFS, XFS a mnoho dalších. DOS podporuje systémy FAT, po instalaci CD/DVD driveru také ISO 9660. Solaris podporuje především UFS a ZFS, ale i mnoho dalších.
Omezení souborových systémů
Různé souborové systémy mohou mít různá omezení, například:
- velikost paměťového média kterou je daný systém schopen pokrýt
- délka souboru
- délka jména souboru
- počet zanořených podadresářů
- podporovaná znaková sada
Žurnálování v systému souborů
Zápis dat a metadat do systému souborů probíhá v několika krocích. Proto nejsou data a metadata v každém okamžiku konzistentní. Dojde-li v takové chvíli k havárii počítače (např. výpadek elektrického proudu, chyba hardware, software a podobně), zůstane systém souborů v nekonzistentním stavu. Z tohoto důvodu je při dalším startu operačního systému vhodné, aby byla provedena kontrola a nekonzistentní data byla opravena. K tomu může dojít automaticky (např. v Linuxu nebo ve Windows 95 a novějších systémech) nebo je nutné spustit kontrolu ručně (systémy DOS). Celková kontrola systému souborů a všech vazeb mezi daty a metadaty je časově velmi náročná operace, při které navíc může dojít ke zbytečné ztrátě již částečně zapsaných informací. Proto jsou moderní systémy souborů rozšířeny o žurnálování, které umožňuje po havárii rychlou opravu eventuálních nekonzistencí. Principem techniky je uchovávání chronologického záznamu prováděných operací, do kterého se zapisují všechny prováděné činnosti. Pokud dojde např. k výpadku napájení, je po restartu nekonzistence opravena návratem do předchozího zaznamenaného stavu za pomoci záznamů z žurnálu. Mezi žurnálovací souborové systémy patří např. NTFS, HFS+, ext3, ext4, XFS nebo ReiserFS.
- Podrobnější informace naleznete na stránce: Žurnálovací systém souborů
Kvóty
Kvóty (anglicky quota) jsou limity nastavené správcem systému, které určitým způsobem omezují použití souborového systému. Nejčastěji se kvóty používají na omezení následujících věcí:
- velikosti využitého místa (usage nebo block quota)
- počtu souborů (file nebo inode quota)
Dále může administrátor systému nastavit varování, tzv. soft quota, které uživatele informuje v případě, že se blíží ke svému limitu (který je pak nazýván hard quota). Často se také nastavuje tzv. grace interval, který v případě potřeby umožňuje krátkodobé mírné překročení kvóty.
Síťové souborové systémy
Síťové souborové systémy (network filesystem) je označení pro systémy souborů, které jsou dostupné prostřednictvím počítačové sítě. Ve skutečnosti leží soubory a adresáře na jiném počítači a přistupujeme k nim pomocí speciálních síťových volání služeb (např. SMB, NFS, CODA apod.). Na vzdáleném počítači jsou pak soubory a adresáře fyzicky uloženy v podobě klasického systému souborů. Speciálními síťovými systémy souborů jsou distribuované souborové systémy (např. GFS v Linuxu), které se mohou rozkládat na několika počítačích, které jsou navzájem propojeny pomocí počítačové sítě.
Databázové souborové systémy
V poslední době se začínají objevovat souborové systémy, které se odklánějí od klasické hierarchické struktury souborů a přiklánějí se více k databázovému pojetí reprezentace dat založené na jejich charakteristikách, tj. například na typu souboru, datu vytvoření, autoru a jiných metadat.
Přehledové tabulky
Tabulka omezení a doplňující informace
Souborový systém | Maximální délka názvu souboru | Použitelné znaky v názvech adresářů[1] | Maximální délka cesty | Maximální velikost souboru | Maximální velikost diskového oddílu[2] | Vyvinul | Používáno od r. | Původní operační systém |
---|---|---|---|---|---|---|---|---|
V6FS | 14b[3] | libovolný bajt kromě NULL a / [3] | Bez omezení[4] | 8 MB | 2 TB | Bell Labs | 1972 | Version 6 Unix |
V7FS | 14b[3] | libovolný bajt kromě NULL a / [3] | Bez omezení[4] | 1 GB | 2 TB | Bell Labs | 1979 | Version 7 Unix |
FAT12 | 255b | Unicode kromě NULL[5] [3] | Bez omezení[4] | 32MiB | 32MiB až (??) 512MiB | Microsoft | 1980 | QDOS |
FAT16 | 8b (původně) / 255b (pouze LFN / VFAT) | Unicode kromě NULL[5] [3] | Bez omezení[4] | 2 Gb / 4 GB | 16 MB až 4 GB | Microsoft | 1983 | MS-DOS verze 2 |
FAT32 | 8b (DOS bez LFN) / 255b (pouze LFN / VFAT) | Unicode kromě NULL[5] [3] | Bez omezení[4] | 2 Gb / 4 GB | 2 TB[6] | Microsoft | 1997 | Windows 95c |
FATplus | 255b | Unicode kromě NULL[5] [3] | Bez omezení[4] | 256GiB | 2TiB | Udo Kuhnt a další | 2006 | Enhanced DR-DOS |
MFS | 30b | libovolný bajt kromě NULL [3] | Bez omezení[4] | ? | ? | Apple | 1983 | Mac OS |
HFS | 30b[5] | libovolný bajt kromě NULL [3] | Bez omezení[4] | ? | ? | Apple | 1985 | Mac OS |
OFS | ? | ? | ? | ? | ? | Metacomco pro Commodore | 1985 | Amiga OS |
HPFS | 255b | Všechny bajty kromě NULL[7] | Bez omezení[4] | 4 GB | 8 GB až 2TB[8] | IBM & Microsoft | 1988 | OS/2 |
NTFS | 255b | Unicode kromě NULL | Bez omezení[4] | 16 TB | 16 EB | Microsoft, Gary Kimura, Tom Miller | 1995 | Windows NT |
HFS+ | 255 znaků[9] | Unicode kromě NULL[10] [3] | ? | 8 EB | 8 EB | Apple | 1998 | Mac OS |
FFS | 255b | Libovolný bajt kromě NULL[3] | Bez omezení[4] | 4 GB | 256 TB | Kirk McKusick | 1983 | 4.2BSD |
Amiga FFS (Amiga) | 255b | Libovolný bajt kromě NULL[3] | Bez omezení[4] | 4 GB | 256 TB | Commodore | 1987 | Amiga OS verze 1.3 |
UFS1 | 255b | Libovolný bajt kromě NULL[3] | Bez omezení[4] | 4 GB až 256 TB | 256 TB | Kirk McKusick | 1994 | 4.4BSD |
UFS2 | 255b | Libovolný bajt kromě NULL[3] | Bez omezení[4] | 512 GB až 32 PB | 1 YB | Kirk McKusick | 2002 | FreeBSD 5.0 |
NILFS | ? | ? | ? | ? | ? | NTT | 2005 | Linux |
ext2 | 255b | libovolný bajt kromě NULL a / [3] | Bez omezení[4] | 16 GB až 2 TB[2] | 2 TB až 32 TB | Rémy Card | 1993 | Linux |
ext3 | 255b | libovolný bajt kromě NULL a / [3] | Bez omezení[4] | 16 GB až 2 TB[2] | 2 TB až 32 TB | Stephen Tweedie | 1999 | Linux |
ext4 | 255b | libovolný bajt kromě NULL a / [3] | Bez omezení | 16 TB | 1 EB | Theodore Ts'o a další | 2006 | Linux |
ReiserFS V3 | 4032b/255znaků | Libovolný bajt kromě NULL[3] | Bez omezení[4] | 8 TB[11] | 16 TB | Namesys | 2001 | Linux |
Reiser4 | ? | ? | Bez omezení[4] | 8 TB na x86 | ? | Namesys | 2004 | Linux |
XFS | 255b | Libovolný bajt kromě NULL[3] | Bez omezení[4] | 9 EB[4] | 9 EB[4] | SGI | 1994 | IRIX |
JFS | 255b | Libovolný bajt kromě NULL[3] | Bez omezení[4] | 8EB | 512TB až 4PB | IBM | 1990 | AIX[12] |
JFS2 | 255b | Libovolný Unicode znak kromě NULL | Bez omezení[4] | 4 PB | 32 PB | IBM | 1999 | OS/2 WSeB |
Be File System | 255b | Libovolný bajt kromě NULL[3] | Bez omezení[4] | 12288b až 260GB[13] | 256 PB až 2EB | Be Inc., D. Giampaolo, C. Meurillon | 1996(?) | BeOS |
NSS | ? | Závisí na použitém jmenném prostoru[14] | Omezení limitované klientem | 8 TB | 8 TB | Novell | 1998 | Netware 5 |
NWFS | 80b | Závisí na použitém jmenném prostoru[14] | Bez omezení[4] | 4 GB | 1 TB | Novell | 1985 | Netware 286 |
ODS-2 | ? | ? | ? | ? | ? | DEC | 1979 | OpenVMS |
ODS-5 | 236b[15] | ? | 4096b[16] | 1 TB | 1 TB | DEC | 2003 | OpenVMS verze 8 |
UDF | 255b | Libovolný Unicode znak kromě NULL | 1023b | 16EB | ? | ISO/ECMA/OSTA | 1995 | - |
UFS | 255b | Libovolný bajt kromě NULL | Bez omezení[4] | 4 GB až 256 TB | 256 TB | Kirk McKusick | 1994 | 4.4BSD |
UFS2 | 255b | Libovolný bajt kromě NULL | Bez omezení[4] | 512 GB až 32 PB | 1 YB | Kirk McKusick | 2002 | FreeBSD 5.0 |
QNX 4.x | 255b | libovolný bajt kromě NULL | 255b | 4 GB | 8 GB až 2 TB (?) | QNX Software Systems QNX | 1990 | QNX |
VxFS | 255b | Libovolný bajt kromě NULL[3] | Bez omezení[4] | 16EB | ? | VERITAS | 1991 | SVR4.0 |
Plan9 Fosil+Venti | ? | ? | ? | ? | ? | Bell Labs | 2003 | Plan9 verze 4 |
ZFS | 255b | Libovolný Unicode znak kromě NULL | Bez omezení[4] | 16EB | 16EB | Sun Microsystems | 2004 | Solaris 10 |
LFFS | ? | ? Unicode znak kromě NULL | ?[4] | ? | ? | Symbian OS | 2003 | Symbian OS S60 6.1 |
Vlastnosti souborového systému
Souborový systém | Typ souboru metadata | Vlastník uložených souborů | Přístupová práva k souborům podle POSIX | Čas vytvoření | Čas poslední změny | Čas posledního přístupu | Last entry change timestamps | Čas poslední archivace | Seznam přístupových práv | Zabezpečení/MAC labels | Pevné odkazy | Symbolické odkazy | Alternate data stream / resource fork |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
FAT12 | ? | N | N | A | A | A | N | N | N | N | N | N | N |
FAT16 | ? | N | N | A | A | A | N | N | N | N | N | N | N |
FAT32 | ? | N | N | A | A | A | N | N | N | N | N | N | N |
FATplus | ? | N | N | A | A | A | N | N | N | N | N | N | N |
HPFS | ? | A[17] | N | A | A | A | N | N | N | ? | N | N | N |
NTFS | ? | A | N[18] | A | A | A | A | N | A | ? | A | A[19] | A |
HFS+ | ? | A | A | A | A | ? | ? | ? | ? | ? | A | A | A |
Žurnálování
Souborový systém | Žurnálovací systém | Meta-data only journaling | Citlivost na velikost znaků | Case-preserving | Logování změn souborů | Delayed allocation | Rozšíření | Proměnlivá velikost datového bloku[20] |
---|---|---|---|---|---|---|---|---|
FAT12 | N | N | N | N | N | N | N | N |
FAT16 | N | N | N | N | N | N | N | N |
FAT32 | N | N | N | N | N | N | N | N |
FATplus | N | N | N | N | N | N | N | N |
HPFS | N | N | N | A | N | N | A | ? |
NTFS | Obnova[21] | A | A | A | A | N | ? | ? |
HFS+ | N | ? | A | A | N | N | N | ? |
FFS | N | N | A | A | N | N | N | N |
UFS1 | N | N | A | A | N | N | N | N |
UFS2 | N | A | A | A | N | N | N | A |
Mac OS X UFS | N | N | A | A | N | N | N | N |
ext2 | N | N | A | A | N | N | N | N |
ext3 | A | A | A | A | N | N | N | ? |
ReiserFS V3 | A | A | A | A | N | N | N | ? |
Reiser4 | A | A | A | A | N | N | A | ? |
XFS | A | A | A | A | A | A | A | ? |
JFS | A | A | A | A | N | N | ? | ? |
Be File System | N | A | A | A | ? | N | N | ? |
NSS | ? | A | A | A | A | N | N | ? |
NWFS | N | N | A | A | A | N | N | ? |
ODS-5 | N | A | N | A | A | N | N | ? |
VxFS | A | N | A | A | A | N | N | ? |
ZFS | N | ? | A | A | N | N | ? | ? |
Poznámky
- ↑ Jedná se o omezení vyplývající ze struktury vlastních adresářových záznamů. Některé ovladače souborových systémů mohou zavést svá vlastní omezení názvů souborů a adresářů; stejně tak i některé operační systémy mohou mít vlastní omezení bez ohledu na použitý souborý systém. MS-DOS, Microsoft Windows a OS/2 nedovolují použití znaků \ / : ? * „ > < | NUL v názvech souborů a adresářů ve všech souborových systémech. Unixy a Linux nedovolují použití znaků / NUL v názvech souborů a adresářů ve všech souborových systémech.
- ↑ 2,0 2,1 2,2 Pro souborové systémy, které mají proměnlivé velikosti alokačních jednotek (bloků/clusterů) je uvedeno rozmezí velikostí, ukazující maximální velikost volume pro minimalní a maximální možnou velikost alokační jednotky souborového systému (např. 512 bytů a 128KiB pro FAT - což jsou velikosti clusterů povoleny pro datovou strukturu na disku, ačkoliv některé ovladače a operační systémy nepodporují velikost clusteru větší než 32KiB).
- ↑ 3,00 3,01 3,02 3,03 3,04 3,05 3,06 3,07 3,08 3,09 3,10 3,11 3,12 3,13 3,14 3,15 3,16 3,17 3,18 3,19 3,20 3,21 3,22 V těchto souborových systémech mají adresářové položky „.“ a „..“ zvláštní význam. Adresářové položky s těmito jmény nejsou zakázané a skutečně existují jako běžné položky adresářů ve struktuře dat na disku. Nicméně jsou povinné, s povinnými hodnotami, jsou automaticky vytvořeny v každém adresáři při jeho vytvoření; a adresáře bez nich jsou považovány za poškozené.
- ↑ 4,00 4,01 4,02 4,03 4,04 4,05 4,06 4,07 4,08 4,09 4,10 4,11 4,12 4,13 4,14 4,15 4,16 4,17 4,18 4,19 4,20 4,21 4,22 4,23 4,24 4,25 4,26 4,27 4,28 4,29 Struktura na disku nemá žádné vlastní omezení. Některé ovladače souborového systému a operační systémy ale mohou mít vlastní limity. MS-DOS nepodporuje cesty delší než 260 bytů pro FAT12 a FAT16. Windows NT nepodporují cesty delší než 32767 bytů pro NTFS.
- ↑ 5,0 5,1 5,2 5,3 5,4 Soubor ve FAT12, FAT16 a FAT32 má krátký název a může mít navíc dlouhý název. Pro dlouhé názvy platí uvedená omezení. Krátké názvy jsou přesně 11 bajtů dlouhé (8 bajtů název, 3 bajty přípona; doplněné mezerami, pokud jsou kratší); nesmí obsahovat znaky NUL (0x00) a 229 (0xE5), které mají zvláštní význam (označení konce adresáře, respektive smazané položky); a při normálním použití neobsahují malá písmena (lowercase). Některé ovladače souborových systémů nebo operační systémy nemusí podporovat dlouhé názvy. Například MS-DOS bez ovladače třetí strany (také Windows 95 a Windows 98 nabootované v režimu MS-DOS) umožńují přístup pouze ke krátkým názvům. Také v OS/2 ovladače k souborovým systémům FAT12 a FAT16 umožńují přístup pouze ke krátkým názvům.
- ↑ I když FAT32 oddíly takové velikosti fungují po vytvoření bez problému, některé programy neumožňují vytvořit FAT32 oddíl větší než 32GB. Mezi tyto programy patří instalační program Windows XP, což svádí k chybné domněnce že se jedná o limit souborového systému.
- ↑ Adresářové položky „.“ a „..“ v HPFS, které je možné vidět v uživatelských programech, jsou víceméně fikce vytvořená ovladači souborových systémů. Ve skutečnosti adresářové datové struktury na disku neobsahují záznamy s takovými názvy, ale místo toho obsahují zvláštní záznam „start“. Přestože adresáře s těmito názvy mohou na disku fyzicky existovat, nemohou být vytvořeny běžnými funkcemi a adresář obsahující takové záznamy je považován za poškozený.
- ↑ To je omezení struktury na disku. Ovladač souborového systému HPFS pro OS/2 používá vrchních 5 bitů čísla sektoru oddílu pro vlastní účely, omezujíc velikost diskového oddílu, který dokáže spravovat na 64 GB.
- ↑ Starší verze HFS podporovala pouze 31 znakové názvy souborů. Kvůli tomu některé starší aplikace nepracovaly dobře se soubory, které měly názvy delší.
- ↑ HFS+ podporuje escape sekvence, která umožňuje použití libovolných Unicode znaků. Uživatelé předchozí verze uvidí escape sekvence místo požadovaných znaků.
- ↑ ReiserFS má teoretické maximum pro velikost souboru 1EB, ale „stránkovací keš to omezuje na 8TB na každé architektuře s 32 bitovým integerem“[1]
- ↑ JFS vychází z AIX a byl kompletně přepsán pro OS/2. Linuxový souborový systém byl založen na verzi z OS/2.
- ↑ Velmi se liší v závislosti na velikosti bloku a fragmentaci block allocation groups.
- ↑ 14,0 14,1 NSS umožňuje, aby soubory měli různá jména v různých jmenných prostorech.
- ↑ Maximální délka názvu souboru včetně přípony může být jen 236 bajtů; přestože každá jméno i přípona samostatně mohou být teoreticky až 255 bajtů dlouhé.
- ↑ Maximální délka cesty může být teoreticky 4096 bajtů, ale limity délek jednotlivých komponent jí omezují na 1664 bajtů.
- ↑ Struktura f-node obsahuje položku pro identifikátor uživatele. Nicméně s výjimkou operačního systému OS/2 Warp Server tato položka nebývá použita.
- ↑ NTFS access control list může vyjádřit každou přístupovou politiku zadatelnou přístupovými právy standardu POSIX, ale rozhranní POSIXového typu není podporováno bez přídavných programů jako Services for UNIX nebo Cygwin.
- ↑ NTFS 5.0 a vyšší umožňuje vytvářet tzv. junctions („křížení“), které dovoluje jednotlivým adresářům (ale nikoliv jednotlivým souborům) namapování kamkoliv do adresářové struktury lokálně spravovaného disku. Lze tak učinit skrze tzv. reparse points, které umožňují flexibilní rozšíření běžného procesu rozlišování jmen.
- ↑ Proměnlivá velikost datového bloku odkazuje na systémy, které podporují různou velikost bloku pro každý soubor. (To je podobné extentům, ale trochu odlišný výběr implementace.) Současná podpora v UFS2 je pouze pro čtení.
- ↑ NTFS ukládá vše, dokonce i souborová data, jako meta-data, takže jeho log připomíná spíš blokové žurnálování.
Externí odkazy
Náklady na energie a provoz naší encyklopedie prudce vzrostly. Potřebujeme vaši podporu... Kolik ?? To je na Vás. Náš FIO účet — 2500575897 / 2010 |
---|
Informace o článku.
Článek je převzat z Wikipedie, otevřené encyklopedie, do které přispívají dobrovolníci z celého světa. |