-
Notifications
You must be signed in to change notification settings - Fork 20
Stopwords
இரா. அசோகன் edited this page Jul 7, 2016
·
6 revisions
Stopwords என்பது நாம் அடிக்கடி பயன்படுத்தும் இடைச்சொல் போன்ற சில வார்த்தைகள். இவ்வார்த்தைகளில் அர்த்தம் குறைவாக இருப்பதால் இவை ஒரு உரையை மற்ற உரைகளிலிருந்து வேறுபடுத்த உதவுவதில்லை. நாம் சில நேரங்களில் மேலும் செயலாக்கும் முன் உரையிலிருந்து இவற்றை வடிகட்டி எடுத்துவிட வேண்டியுள்ளது.
நான் இந்த 125 வார்த்தைகள் கொண்ட Stopwords பட்டியலை TXM சொற் களஞ்சியத்தில் முதல் 300 குறியீடுகளிலிருந்து (வார்த்தைகளும் நிறுத்தற்குறிகளும்) தயாரித்தேன்.