המילון ההיסטורי ללשון העברית
מתוך ויקיפדיה, האנציקלופדיה החופשית
המילון ההיסטורי ללשון העברית הוא מפעל מחקרי רחב היקף של האקדמיה ללשון העברית, שמטרתו להעמיד מילון מדעי ללשון העברית על כל רבדיה ההיסטוריים, מן העת העתיקה ועד שנת 1947.
תוכן עניינים |
[עריכה] הקמת מפעל המילון ההיסטורי
יוזם מפעל המילון ההיסטורי היה נשיאהּ הראשון של האקדמיה ללשון העברית, פרופ' נפתלי הרץ טור סיני, שהעלה את הרעיון בשנות החמישים. ההחלטה על הקמת המפעל התקבלה באקדמיה בשנת 1955.[1] בשנים הראשונות נעשתה מלאכת הכנת המילון בלשון המקרא בלבד, בראשותו של פרופ' טור סיני ובמימון מוסד ביאליק.
בשנת 1959 הוחלט לשנות את מתכונת המילון. במקום לשון המקרא, הוחלט להתמקד בלשון החוץ מקראית, והקשר עם מוסד ביאליק נותק. האקדמיה החליטה על הקמת "מועצת מערכת המילון ההיסטורי",[2] ולמנהל המילון נתמנה פרופ' זאב בן חיים, אשר עמד בראש מפעל זה עד שנת 1992.
לצורך קביעת דמותו של המילון, ביקר בן חיים במערכות של מילונים חשובים באירופה, ביניהם ה-Oxford English Dictionary, וה-Thesaurus Linguae Latinae. דין וחשבון על ממצאיו פורסמו בשנת 1959.[3]
משנת 1992 ועד היום עומד בראש המפעל אברהם טל, פרופסור אמריטוס ללשון עברית באוניברסיטת תל אביב, וסגן נשיא האקדמיה ללשון העברית.
[עריכה] הכנת המילון
[עריכה] איסוף המקורות
השלב הראשון בהכנת המילון היה בחירת היצירות שמהן יישאב החומר למילון. לצד היצירות החשובות מבחינת השפעתן על האומה (מקרא, משנה, תלמוד, מדרש) נקבע כי המקורות למילון יכללו גם יצירות הנותנות ייצוג לתקופות שונות ולמקומות גיאוגרפיים שונים, אף אם חשיבותן הספרותית אינה רבה. כמו כן נכללו חיבורי הקראים, ונראה שאף חיבורי השומרונים עתידים להיכלל בין המקורות.
היות שמדובר במקורות רבים מאוד, החליט בן חיים להתמקד במקורות העת העתיקה: מחתימת המקרא ועד סוף תקופת הגאונים. הוחלט שלא לכלול את המקרא בין מקורות אלו, משום שהחומר המקראי נתון לחוקרים בקונקורדנציות ובמילונים טובים, וניתן בקלות לשאוב אותו משם. בהתאם לתוכנית זו הוציאה האקדמיה בשנת 1963 את "ספר המקורות", הכולל רשימה כרונולגית מפורטת של המקורות למילון, ולגבי כל מקור - באילו מהדורות וכתבי יד הוא נתון, ומהו כתב היד שממנו יובא החומר למילון. מהדורה שנייה מתוקנת של ספר המקורות יצאה בשנת 1970.
בין המקורות למילון ניתן למנות את:
- החומר האפיגרפי הקדום (חרסי לכיש, מגילות מדבר יהודה, תעודות נחל חבר)
- המשנה (על פי כתב יד קאופמן)
- התלמוד הבבלי (על פי כתבי יד תימניים)
- התלמוד הירושלמי (על פי כתב יד ליידן)
- מדרשי הלכה
- מדרשי אגדה
[עריכה] הקמת מסד הנתונים
השלב השני בהכנת המילון היה הכנת התשתית הטקסטואלית לצורך ליקוט חומר הגלם למילון. כל המקורות הספרותיים שנקבעו כבסיס למילון הועתקו למסד נתונים ממוחשב על פי כתב היד הטוב ביותר שלהם. עובדי המילון עברו על כל מילה במסד הנתונים ותייגו אותה לערך המילונאי שאליה היא משתייכת. בצורה זו הלכה ונוצרה קונקורדנציה רחבת היקף של כל המקורות העבריים הנכללים במאגר, ועובד המילון יכול היה לשלוף, תוך שניות בודדות, את כל המשפטים שבהם מופיעה מילה מסוימת בכל המקורות שהועלו למסד הנתונים.
בשנת 1992, עם הגיעו לגיל 84, פרש פרופ' זאב בן חיים מניהול המילון, ותחתיו נתמנה פרופ' אברהם טל. פרופ' טל החליט לפתוח את מסד הנתונים, שעד כה היה זמין לעובדי המילון בלבד, לציבור הרחב. בעקבות החלטתו זו יצא מספר שנים מאוחר יותר (1998) תקליטור הכולל את מסד הנתונים הממוחשב של התקופה העתיקה וכן תוכנה לחיפוש. תקליטור זה כונה "מאגרים".
בשנת 1994, לקראת סיום השלב של הקמת מסד הנתונים, פירסמה האקדמיה ערך לדוגמה מתוך המילון. הערך שנקבע היה השורש ער"ב על כל נגזרותיו, כגון: מערב, ערובה, עירובון, ערביים וכו' (למעשה מדובר במספר שורשי ער"ב הומוגרפיים). הערך לדוגמה כולל 88 עמודים, והוא התפרסם בכתב העת "לשוננו" שמוציאה האקדמיה ללשון העברית.[4]
מספר שנים מאוחר יותר, ועקב הצורך המתמיד לעדכן את מסד הנתונים, הוחלט לזנוח את פרסום המאגר באמצעות תקליטור, ולעבור לשיטה מקוונת. בשנת 2005, לאחר תקופת ניסיון קצרה, הועלה מסד הנתונים לאתר האינטרנט של האקדמיה ללשון העברית, ושמו - כשם התקליטור - "מאגרים". הגרסה המקוונת של "מאגרים" נחנכה באופן רשמי על ידי ראש הממשלה אהוד אולמרט בעת ביקורו באקדמיה ב־19 ביוני 2006, והיא נגישה כיום לכל דכפין תמורת דמי שימוש שנתיים.
כיום כולל מסד הנתונים את כל החיבורים העיקריים של הלשון העברית בעת העתיקה. נכון לחודש יוני 2006 הוקלדו למאגר למעלה מ-4,300 חיבורים, הכוללים למעלה מתשעה מיליוני מלים. העבודה על מסד הנתונים נמשכת באופן מתמיד, הן בשל הצורך לעדכן את המסד על פי התקדמות המחקר, והן משום שמעת לעת מתגלים חיבורים עתיקים נוספים.
[עריכה] כתיבת הערכים
אף על פי ששלב הכנת מסד הנתונים טרם הסתיים במלואו (וספק אם יסתיים בעתיד הנראה לעין), החלה האקדמיה בשנת 2006 בשלב השלישי והאחרון, והוא כתיבת הערכים של המילון. מטעמי נוחות הוחלט להתחיל בערכים של האות תי"ו. את הערכים כותבת מערכת המילון, שחברים בה עורך המילון וכן מספר מרצים מהחוגים ללשון העברית באוניברסיטאות שונות. כותב הערכים הראשי הוא ד"ר גבריאל בירנבאום מאוניברסיטת בר אילן.
בחודש יוני 2006 הופצה בין חברי האקדמיה מהדורה נסיונית של המילון, הכוללת את הערכים שנכתבו עד כה. לשם המחשה, הערך תרגם מתפרס במהדורה זו על פני 14 טורים, והערך תרנגול מתפרס על פני 12 טורים.
[עריכה] המילון כיום ובעתיד
אף על פי שהמילון החל להיכתב רק בשנת 2006, מסד הנתונים שהוכן עבורו משמש חוקרים רבים, וכמעט אין עבודת מחקר שנעשית בתחום העברית הקלאסית וספרותה שאינה נזקקת בצורה ישירה או עקיפה למאגר זה.
אין תאריך לסיום העבודה על המילון, אולם בקצב הנוכחי (התלוי בעיקר במימון שהאקדמיה מקבלת מהמדינה) ספק רב אם יושלם לפני שנת 2050. לאור היקפו העצום והתקופה בה הוא יושלם יש להניח שכאשר יושלם המילון הוא לא יודפס, והגישה אליו תהיה באמצעות מחשב בלבד.

