Skip to content

Stopwords

இரா. அசோகன் edited this page Jun 21, 2021 · 6 revisions

அடிக்கடி பயன்படுத்தும் இடைச்சொற்கள் (Stopwords)

Stopwords என்பது நாம் அடிக்கடி பயன்படுத்தும் இடைச்சொல் போன்ற சில சொற்கள். இச்சொற்களில் பொருள் குறைவாக இருப்பதால் இவை ஒரு உரையை மற்ற உரைகளிலிருந்து வேறுபடுத்த உதவுவதில்லை. நாம் சில நேரங்களில், மேலும் செயலாக்கும் முன், உரையிலிருந்து இவற்றை வடிகட்டி எடுத்துவிட வேண்டியுள்ளது.

நான் இந்த 125 சொற்கள் கொண்ட Stopwords பட்டியலை TXM சொற் களஞ்சியத்தில் முதல் 300 சொற்குறிகளிலிருந்து (சொற்களும் நிறுத்தற்குறிகளும்) தயாரித்தேன்.