נתונים
מתוך ויקיפדיה, האנציקלופדיה החופשית
נתונים הם פרטי מידע הנכנסים כקלט לתוך מערכת מידע (במובן הכללי שלה: מערכת המעבדת מידע ומפיקה פלט). מקור השם נתונים (Data) הוא בלטינית, בה המילה Data היא לשון רבים של datum. באנגלית השימוש המילה Data נעשה בלשון יחיד.
נתון משמעו הגדרת ערך (Value) למשתנה (Variable). ההגדרה יכולה להיות באמצעות סמלים או סימנים בעלי משמעות בהקשר של המשתנה. מתן הערך נעשה על ידי תצפית או ניסוי.
לדוגמה : המספר 10 הוא ערך. הגדרת המספר 10 כערך של משתנים שונים תהפוך אותם לנתונים. השעה: 10. הגיל: 10. המרחק: 10. עשר יכול גם להיות הערך של משתנה מצב הרוח. לרוב מלבד המשתנה נדרשת גם הגדרה של יחידת המידה. לדוגמה: המחיר 3 הוא נתון שלשם הבנת משמעותו יש לציין גם את יחידת המטבע הרלוונטית (3 אגורות, 3 שקלים, 3 דולרים). להגדרת הנתון שעה, נוסף על יחידת המידה יש לרוב לציין גם אם מדובר בשעת בוקר או אחר הצהריים, וכן יש לציין את המיקום הגאוגרפי. המילה כלנית היא ערך. כנתון, כלנית יכולה להיות הגדרה של: סוג פרח, שם, שם רחוב.
בתחום המחשוב, נעשית לרוב אבחנה בין נתונים גולמיים (raw data), למידע (Information). כאשר נתונים מוגדרים כמספרים, אותיות, סמלים, ומידע מוגדר כנתונים שעברו עיבוד. לדוגמה: ממוצע של נתוני משכורת הוא עיבוד של נתונים קיימים. התוצאה שהתקבלה, יכולה כשלעצמה להפוך לנתון. כלומר הקניית הערך שהתקבל כתוצאת החישוב, למשתנה משכורת ממוצעת. במקרים רבים תהליכי עיבוד הם בעלי שלבים רבים, כך שתוצר העיבוד של שלב אחד הופך לנתון גולמי של תהליך העיבוד הבא. כמו כן, במקרים רבים המידע המבוקש מן המערכת, הוא נתון שקיים בה, לדוגמה המשכורת של עובד מסוים. והעיבוד שנעשה הוא הגישה למערכת והוצאת הנתון.
האבחנה בין נתונים למידע עשויה לעיתים להיות קשה. בשנות השישים מערכות מבוססות מחשב כונו מערכות לעיבוד נתונים (Data Processing Systems) ובהמשך ההגדרה השתנה ל מערכות מידע (Information Systems).
יצוג נתונים מבוצע במחשב באמצעות סיביות (bit), כאשר רצף סיביות יחד מייצגות תו (אות, מספר או סימן). במחשב אנלוגי הנתונים מיוצגים על ידי גדלים פיזיקליים. מרבית המחשבים האנלוגיים הם חשמליים והנתונים מיוצגים בהם לרוב על ידי מתח או זרם. במחשבים אנלוגיים מכניים, הנתונים מיוצגים עי מרחק או מיקום.
ניתן לאכסן את הנתונים בזכרון המחשב באופנים שונים, לצורך ניהול ושליפה מהירה. לשיטה בה הנתונים מאוחסנים, מבנה נתונים יש חשיבות עבור אלגוריתמים שונים. אחת השיטות הנפוצות ביותר לאכסון כמות רבה של נתונים היא מסד נתונים או בסיס נתונים (Data Base). אוסף גדול של מסדי נתונים מוגדר כמחסן נתונים (Data Warehouse).
עבור מחסני הנתונים מוגדרים כלים סטטיסטיים, המבצעים כריית נתונים ( Data Mining), כלומר מציאת קשרים סטטיסטיים בין נתונים שונים, שיכולים להעיד על קיום קשרים כאלו בפועל. לדוגמה: מתוך נתוני מכירות, מציאת קשר בין יום בשבוע לבין סוג הקונים שמגיעים לבצע קניות ברשת הקניות באותו יום.

