File format
از ویکیپدیا، دانشنامهٔ آزاد.
فرمت فايل : از وايکی پديا ، دايره المعارف آزاد پرش به search navigation فرمت فايل ، را ويژه ای است جهت کدگذاری اطلاعات برای ذخيره در يک " فايل کامپيوتر " . از آنجايي که يک درايو يا در واقع هر بخشی از حافظه برای ذخيره اطلاعات کامپيوتری ، می تواند فقط بيتها را ذخيره کند ، کامپيوتر بايد راههايي جهت تبديل اطلاعات به صفر و يک داشته باشد . انواع مختلفی از فرمت ها برای حالت های متفاوتی از اطلاعات است . در داخل هر نوع فرمت ، بطور مثال اسناد پروسسور کلمه ، چندين فرمت متعدد وجودد خواهد داشت . گاهی اوقات اين فرمت ها با يکديگر رقابت می کنند . موضوعات : 1. عموميت 2. خصوصيات 3. مشخص نمودن نوع فايل 1-3- پسوند اسم فايل 2-3- عدد جادويي 3-3- ديتای ساده و صريح 1-3-3- کدهای نوع Mac Os 2-3-3- شناسه های نوع يکسان Mac Osx ( UTIs ) 3-3-3- مشخصه های توسعه يافته Os/2 4-3-3- مشخصه های توسعه يافته PO SIX 5-3-3- شناسه های منحصر به فرد PRONOM 6-3-3- انواع MIME 7-3-3- شناسه های فرمت فايل ( FFIDs )
4- ساختار فايل 1-4- رونوشت های حافظه پردازش شده / فرمت های غير ساختاری 2-4- قطعه پايه گذاری کننده فرمت ها 3-4- دايرکتوری پايه گذاری کننده فرمت ها
5- مراجع 6- بعلاوه اين را هم ببينيد 7- لينک های خارجی
1- عموميت : بعضی از فرمت های فايل جهت مرتب سازی اطلاعات مخصوص طراحی شده اند : فرمت : JPEG ، برای مثال ، فقط برای ذخيره " تصاوير " عکسی ثابت طراحی شده است . فرمت های فايلی ديگر ، اما برای ذخيره اطلاعات چندين نوع متفاوت اطلاعات طراحی شده انند : فرمت : GIF ، ذخيره تصاوير بی حرکت و انيميشن ساده ( هر دو ) را پشتيبانی می کند و فرمت QuickTime می تواند به عنوان يک محفظه برای چندين نوع متفاوت " multimedia " عمل کند . يک فايل " Text " بسادگی هر متنی را در يک فرمت از جمله ASCII يا utf-8 يا هر کاراکتر ديگر ذخيره می کند . بعضی از فرمت های فايل از جمله HTML يا " کد منبع " زبان برنامه نويسی ويژه ، در حقيقت نيز فايلهای متنی هستند اما متفق بودند برای قوانين مخصوصی که به آنها اجازه می دهند تا برای اهداف ويژه استفاده شوند . گاهی اوقات ممکن است برای ايجاد برنامه ای جهت بازخوانی فايل ، در يک فرمت کدگذاری کنند همچنانکه آن در فرمت ديکر کدگذاری شده است .
برای مثال ، کسی می تواند يک سند " Microsoft Word " را باز می کند همچنانکه آن يک آهنگ بوده است که با برنامه فعال کننده موزيک کار می کرده است که در فايلهای صوتی " سر صفحه کمتر " سازماندهی می شود ، گر چه که نتيجه ، صدای خيلی موزيکالی را ندارد . اين مورد خيلی زياد است چون ترتيب محسوس بيتها در يک فرمت تقريباً هميشه ، مزخرف است .
2- خصوصيات : اغلب فرمت های فايل ، شامل تعدادی از فرمت های فايل شناخته شده ، مدرک مشخصات منتشر شده ای دارند ( اغلب با يک " پياده سازی مرجع " ) که بطور دقيقی بيان می کند که چگونه اطلاعات بايد کدگذاری شوند و اينکه می تواند استفاده شوند برا یتعيين در همه حال يک برنامه ويژه که بطور صحيح به يک فايل برنامه ويژه مربوط می شود . هر چند دو دليل وجود دارد که چرا اين هميشه ، قضيه نيست . اولاً تعدادی از شرکت های طراحی کننده فرمت فايل ، اسناد مشخصه های آنها را به عنوان " رموز تجاری " ارائه می کنند و بنابراين آنها را ميان همگان منتشر نمی کنند . ثانياً ، تعدادی از شرکت های طراحی کننده فرمت فايل هرگز زمانی را برای نوشتن مدارک مشخصات مجزا صرف نمی کنند ؛ بلکه ضمناً فرمت فقط از ميان برنامه هايي تعريف می شود که داده ها را در يک فرمات ويرايش می کنند . استفاده از فرمتهای فايل بدون مشخصات قابل دسترس عموم می تواند گران باشد . يادگيری اينکه چگونه فرمت کار می کند هم مستلزم " مهندس معکوس " است . که آن را پياده سازی ماخذه ناشی می گردد و هم بدست آوردن مدارک خصوصيات برای حق الزحمه از شرکت های طراحی کننده فرمت . اين دومين شيوه فقط زمانی ممکن است که يک فايل خصوصيات موجود باشد و بطور نمونه مستلزم امضای توافق نامه بازگشايي می باشد . هر دو استراتژی ، احتياج به زمان يا پول قابل توجه و يا هر دوی آنها دارد . بنابراين به عنوان يک قانون عمومی ، فرمت های فايل با خصوصيات قابل دسترس عموم توسط شمار زيادی از برنامه ها پشتيبانی می شوند در حاليکه فرمتهای غير عمومی فقط توسط محدودی از برنامه پشتيبانی می شوند . قانون امتياز نامه " نسبت به حق چاپ " اغلب بيشتر برای حفاظت که از يک فرمت فايل استفاده می گردد . اگر چه امتياز نامه ها برای فرمتهای فايل بطور مستقيم تحت قانون US مجاز شده اند ، تعدادی از فرمتها احتياج به کدگذاری ديتا با الگوريتم های ثبت شده دارند و اگر چه در ابتدا دارنده امتياز نامه ، آن را وادار نمی کند که ليکن آنها بعداً شروع به جمع آوری حق الزحمه برای استفاده از الگوريتم می کنند . اين در کاهش قابل توجه در استفاده از GIF نتيجه داده است و تا حدی برای پيشرفت فرمت PNG تناوبی ممکن است . گر چه امتياز نامه در ميانه سال 2003 در آمريکا در ميانه سال 2004 در کل جهان منقضی شده است . الگوريتم هايي که معمولاً نگه داشته می شوند ، تحت قانون رايج اروپايي ثبت نشده اند که اين نيز شامل قوانينی است که اعضاء بايد اطمينان يابنتد هر جايي که استفاده از تکنيک ثبت شده برای هدف مهم از جمله اطمينان يافتن از تغيير قراردادها احتياج شده است که در دو سيستم کامپيوتر متفاوت يا شبکه استفاده شده است برای اجازه ارتباط و مبادله محتوای ديتا بين آنها که اين قبيل استفاده برای بودن يک نقض قانون امتياز نامه مطرح نشده است ، که ظاهراً بايد به پياده سازی يک سيستم فايل ثبت شده اجازه داده شود در جايي که لازم است تا دو کامپيوتر متفاوت در يک جا کار کنند . 3- مشخص نمودن نوع فايل : از آنجايي که فايلها توسط برنامه به عنوان جريانات ديتا مشاهده شده اند ، روشی جهت تعيين فرمت يک فايل ويژه درون " سيستم فايل " ، يک مثال از متديتا لازم است . " سيستم های عملکردی " متفاوت بطور متناوب ، راههای مختلفی را برای اين مشکل اتخاذ نموده اند که هر راه سودها و مضرات خاص خودش را دارد . البته ، چندين سيستم عملکردی مدرن ، و کاربردهای انفرادی ، نياز به استفاده از همه راهها برای اجرای فايلهای گوناگون دارد که در آخر بايد برای تفسير فرمتهای فايل " خارجی " فعال گردد در صورتيکه با آنها بطور کامل کار نکنند . 1-3- پسوند اسم فايل : يک روش معمولی که با چندين عملکردی شامل Mac OSX ، CP/M ، DOS ، VMS ، VM/CMS و windows استفاده می شوند ، تعيين فرمت فايلی است که بر پايه سنجش بخش اسم آن است که اين دوره پايانی را دنبال می کند . اين بخش از اسم فايل به عنوان " پسوند اسم فايل " شناخته شده است . برا ی مثال ، مدارک HTML ، با اسم هايي که انتهای آنها با html ، يا htm می باشند و تصاوير GIF با git تشخيص داده می شوند . در سيستم فايل FAT اصلی ، اسم های فايل به يک متمايز کننده هشت کاراکتری و يک پسوند سه کاراکتری محدود می شود که به عنوان " اسم فايل 803 " شناخته می شود . بنابراين هنوز خيلی از فرمت ها از پسوندهای سه کاراکتری استفاده می کنند حتی اگر چه سيستم عملکردی مدرن و برنامه های کاربردی نه خيلی طويل ، اين محدوديت را دارند . از آنجايي که ليست استانداردی از پسوندهای موجود نيست ، پيش از يک فرمت می تواند از پسوندهای يکسانی استفاده کند که اين در نتيجه می تواند سيستم عملکردی و کاربرها را به اشتباه بياندازد . يک شکل از اين راه بدين صورت است که سيستم می تواند به راحتی گول زده شود به عمل يک فايل به عنوان يک فرمت متفاوت با تغيير اسم آن به سادگی به عنوان مثال يک فايل HTML می تواند به راحتی به عنوان يک متن ساده با تغيير نام آن از " html اسم فايل به"txt اسم فايل " عمل کند . گرچه که اين استراتژی مفيد است برای کاربران متخصصی که می تواند به راحتی اين اطلاعات را بفهمند و با تدبير انجام دهند . وليکن خيلی اوقات کاربران فنی کمتری که بطور تصادفی يک فايل را ممکن است غير استفاده ( يا آن را از دست بدهند ) کنند با تغيير نادرست آن ، را دچار سردرگرمی می کند . اين ، بيشتر بدنه های سيستم عملکردی اخير از جمله window 95 و Mac OSX را هدايت می کند تا پسوند را زمانی که ليست فايل های شناخته شده را نمايش می دهد ، مخفی کند . اين کاربرد را از نام فايل کامل مجزا می کند تا تغيير ناگهانی نوع فايل جلوگيری کند هنگامی که به کاربران خبره اجازه می دهند تا هنوز ، اصلی را بطور حرفه ای بواسطه فعال سازی نمايش پسوندهای فايل نگه دارند . 2-3- عدد جادويي : يک روش ديگر که اغلب با Unix و مشتقات آن مرتبط است ، اين است که يک " عدد جادويي " را درون خود فايل ذخيره می کند . در اصل ، اين بخش برای مجموعه ويژه ای از مشخص کننده های 2 بيتی در آغاز يک فايل استفاده شده است ، اما از آنجايي که هر ترتيب بانيری از کد خارج نشده ای می تواند به عنوان يک عدد مورد توجه قرار بگيرد ، هر صورتی از يک فرمت که بصورت فردی آن را تميز می دهد، می تواند برای تطبيق مورد استفاده قرار بگيرد . به عنوان مثال تصاوير GIF هميشه با نمايش ASCII از GIF87a يا GIF89a شروع می شوند که استانداردرا وابسته می کند به آنچه که توافق کرده اند . بعضی از انواع فايل ، مخصوصاً فايلهای متنی ساده ، برا یتشخيص با اين متد سخت تر هستند . فايل های HTML به عنوان مثال ممکن است با رشته < htm1 > ( که حالت حساس نيست ) شروع شوند و يا با تعريف نوع مدرک متناسب است که با DOCTYPE !> شروع می شود و يا برای XHTML ، تمايز کننده XML ، که با XM1 ؟> شروع می گردد . فايل ها نيز ممکن است با هر متن تصادفی يا چندين خط خالی شروع شوند اما هنوز HTML غير قابل استفاده باشند . اين راه ، گارانتی های بهتری را پيشنهاد می کند که فرمت بدرستی تشخيص داده خواهد شد ، و اغلب می تواند خيلی از اطلاعات دقيق و صريح را در مورد فايل معين کنند . از آنجايي که قسمت های " عدد جادويي " معتبر می توانند نسبتاً پيچيده باشند ، و هر فغرد بايد بطور مؤثری در مقابل هر امکان درديتابيس جادويي تست شده باشد ، اين راه نيز نسبتاً بی فايده است ، مخصوصاً برای نمايش ليست های بزرگ فايلها ( در مقابل روشهای پايه گذاری شده برای اساس متاديتا و اسم فايل فقط نياز به چک کردن بخشی از ديتا را دارد و آن را در مقابل با يک شاخص ذخيره شده جور می کند ) . همچنين ديتا بايد از خود فايل خوانده شود که افزايش پنهانی به عنوان نقطه مقابل متاديتايي است که در يک دايرکتوری ذخيره می شود . جايي که انواع فايل تصديق در اين راه را برای يک برنامه جهت چک کردن است د رحاليکه فايلی که گفته شده است برای اجرای آن ، از فرمت صحيح است : در حاليکه متاديتايا اسم فايل ممکن است بطور وابسته ای از محتوايش تغيير کند و نداشتن يک تست عدد جادويي خوب طراحی شده ، يک علامت مطمئن زيبا است که فايل يا معيوب است يا از نوع خراب است . پس خطوط " شبانگ " گفته شده در فايلهای اسکريپت ، حالت خاصی از اعداد جادويي هستند . اينجا ، عدد جادويي متن قابل خواندن توسط انسان است که يک مترجم امر خاص و اختيارات آن را مشخص می کند جهت انتقال به مترجم متن . 3-3- متاديتای ساده و صريح : راه نهايي ذخيره فرمت يک فايل بطور صريح اين است که اطلاعات را در سيستم فايل ذخيره کنيم . اين راه ، متاديتا را جدا از ديتای اصلی و اسم نگه می دارد اما پرتابل کمتر از 5 پسوند يا " اعداد جادويي " نيز هست ، از آنجائيکه فرمت بايد از سيستم فايل به سيستم تغيير پيدا کند . در حااليکه اين نيز بافضايي با پسوندهای اسم فايل صحيح است بطور مثال برای سازگاری با حد سه کاراکتری DOS - MS بيشتر فرم های نگهداری تقريباً يک هريف معادل از اسم فايل دارد اما ممکن است تغيير يا هيچ تصويری از ديتای آينده نداشته باشد . نکته اين فايل های Zip يا فايل های آرشيو ، مشکل استعمال متاديتارا حل می کنند . يک برنامه سودمند ، فايلهای متعدد را درون خودش با متاديتا در مورد هر فايل يا فولدر دايرکتور جمع می کند که آنها همه ناشی از درون يک فايل تازه ( به عنوان مثال فايل Zip با پسوند Zip ) است . فايل جديد نيز فشرده می شود و شايد اينکريپت شود ، اما حالا به عنوان يک فايل متن / اسکی در طول سيستم های عملکردی توسط سيستم های ftp يا ضميمه شده به ايميل قابل انتقال است . در نهايت ، آن بايد توسط يک منفعت ساز گار با مفيد بودن از فشردگی خارج گردد اما مشکلات انتقال اين راه را حل کرده است .

