Миллий корпус яратишнинг технологик жараёни хусусида
Мақолада тилнинг интернет, компьютер технологиялари тилига айланиши математик лингвистика, унинг давоми бўлган компьютер лингвистикасининг шаклланганлиги ва ривожланиш даражаси билан боғлиқлиги, айниқса, сунъий интеллект учун табиий тилларни моделлаштириш муаммоси хусусида мушоҳада юритилган. Ўзбек тилининг халқаро мақомини оширишда ўзбек тили миллий корпуси катта аҳамиятга эга. Компьютер лингвистикаси фани доирасида амалга ошири лаётган ишлар ўзбек тилидаги мавжуд муаммоларни ҳал этишда муҳим роль ўйнайди. Мақолада миллий корпус яратишнинг за руратлари нимада эканлиги, таълим жараёнида сўзнинг нозик қиррасини ўрганиш, уни нутқида қўллаш кўникмасини ша кллантиришда нимага таяниш кераклиги, ўзбек тили миллий корпуснинг фан ва миллат учун нима аҳамияти борлиги, ўзбек тили миллий корпуснинг асосий фойдаланувчилари ким бўла олиши мумкинлиги хусусида асосли фикр мулоҳазалар билдирилди. Корпуснинг асосий фойдаланувчилари, албатта, турли йуналишларда иш олиб бораётган тилшунос тадқиқотчилардир. Маълум бир даврдаги тилга оид ишончли статистик маълумотлар адабиётшунослар, тарихчилар ва бошка гуманитар соҳалар вакилларини ўзига жалб этиб келгандир. Тилни ўқитишда ҳам миллий корпуснинг ахамияти каттадир. Миллий корпус яра-тишнинг технологик жараёни хусусида фикр-мулоҳазалар баён қилинди. Жумладан, миллий корпус технологик жараёни: тан ланган матнлар асосида лексема ва сўз шаклларининг такрорланиши луғатини яратиш; олинган такрорланиш луғатининг ҳар қандай бирлиги учун матнни кўриб чиқиш; графикли сўзни бўғинга ажратиш ва бўғинларнинг такрорланиш луғатини тузиш; сўз захираларини саралаш; бир вақтнинг ўзида чекланма-ган файлларни қайта ишлаш; ташқи белгиларга эга бўлган матнлар корпусларини яратиш кабилардан иборатлиги изоҳлаб бе рилган.