Logo az.boatexistence.com

Pythonda tokenize nədir?

Mündəricat:

Pythonda tokenize nədir?
Pythonda tokenize nədir?

Video: Pythonda tokenize nədir?

Video: Pythonda tokenize nədir?
Video: chr() & ord() in Python - Using ASCII Values 2024, Bilər
Anonim

Python tokenizasiyası əsasən daha böyük mətnin daha kiçik sətirlərə, sözlərə bölünməsinə və ya hətta qeyri-ingilis dili üçün sözlər yaradılmasına aiddir.

Python-da Tokenize-dən necə istifadə edirsiniz?

Təbii Dil Alət dəsti (NLTK) buna nail olmaq üçün istifadə olunan kitabxanadır. Söz tokenizasiyası üçün python proqramına davam etməzdən əvvəl NLTK quraşdırın. Daha sonra paraqrafı fərdi sözlərə bölmək üçün söz_tokenləşdirmə metodundan istifadə edirik. Yuxarıdakı kodu icra etdikdə o, aşağıdakı nəticəni verir.

NLTK Tokenize nə edir?

NLTK daha iki alt kateqoriyaya təsnifləşdirilən tokenize adlı moduldan ibarətdir: Word tokenize: Biz cümləni işarələrə və ya sözlərə bölmək üçün word_tokenize metodundan istifadə edirik. Cümlə işarəsi: Sənədi və ya paraqrafı cümlələrə bölmək üçün sent_tokenize metodundan istifadə edirik.

Tokenize dedikdə nə nəzərdə tutulur?

Tokenləşdirmə həssas məlumatların əhatə dairəsinə daxil edilmədən verilənlər bazasında və ya daxili sistemdə istifadə edilə bilən"token" adlı qeyri-həssas verilənlərə çevrilməsi prosesidir. Tokenizasiya orijinal datanı eyni uzunluqda və formatda əlaqəli olmayan dəyərlə əvəz etməklə həssas datanın təhlükəsizliyini təmin etmək üçün istifadə edilə bilər.

Tokenize proqramlaşdırmada nə deməkdir?

Tokenizasiya sətirlərin sözlər, açar sözlər, ifadələr, simvollar və token adlanan digər elementlər kimi parçalara bölünməsi aktıdır.

Tövsiyə: