பெரிய ஆவணத் தேடலுக்கு Claude Code-ஐ எவ்வாறு வேகப்படுத்துவது?

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialகடந்த வாரம்2min read

பெரிய ஆவணத் தேடலுக்கு Claude Code-ஐ எவ்வாறு வேகப்படுத்துவது?

Claude Code பத்து கோப்புகளுடன் சிறப்பாகச் செயல்படும். ஆனால் நூற்றுக்கணக்கான PDF கோப்புகள் இருக்கும்போது அதன் வேகம் குறைகிறது.

உங்கள் கோப்புகளின் எண்ணிக்கை அதிகரிக்கும் போது, நீங்கள் மூன்று பிரச்சனைகளை எதிர்கொள்கிறீர்கள்:

மாடல் அதிகப்படியான உரையைப் படிப்பதால் வேகம் குறைகிறது.
ஒவ்வொரு ஸ்கேன் செய்யப்பட்ட டோக்கனுக்கும் நீங்கள் பணம் செலுத்த வேண்டியிருப்பதால் செலவுகள் அதிகரிக்கின்றன.
பதிலைக் கண்டறிய முடியாதபோது மாடல் யூகிக்கக்கூடும் என்பதால் துல்லியம் குறைகிறது.

பிரச்சனை மாடலில் இல்லை. பிரச்சனை தேடல் உத்தியில் (search strategy) உள்ளது.

இயல்பாகவே, Claude Code கோப்புகளை நேரடியாகப் படிக்கிறது. ஒரு பதிலைக் கண்டறிய அது அனைத்தையும் ஸ்கேன் செய்கிறது. இது உங்கள் கேள்வியின் கடினத்தன்மையைப் பொறுத்து இல்லாமல், உங்கள் நூலகத்தின் (library) அளவைப் பொறுத்து மாறுபடுகிறது.

இதற்கான தீர்வு Retrieval Augmented Generation (RAG) ஆகும்.

ஒரு பெரிய வேலையாகச் செய்வதற்குப் பதிலாக, நீங்கள் வேலையைப் பிரிக்கலாம்: • ஒரு retrieval layer முதலில் ஏற்கனவே உருவாக்கப்பட்ட index-ஐத் தேடுகிறது. • இது பதிலைக் கொண்டுள்ள குறிப்பிட்ட பகுதிகளைக் கண்டறிகிறது. • அந்தச் சிறிய பகுதிகளை மட்டுமே Claude Code-க்கு வழங்குகிறது.

இது வேலையைத் தொடர்ச்சியாக வைத்திருக்கிறது. உங்களிடம் ஐம்பது கோப்புகள் இருந்தாலும் அல்லது ஐம்பதாயிரம் கோப்புகள் இருந்தாலும், Claude ஒரு சிறிய அளவிலான உரையை மட்டுமே படிக்கும்.

இதை Model Context Protocol (MCP) மூலம் Claude Code-உடன் இணைக்கலாம். ஒரு MCP server என்பது சரியான தரவைப் பெறுவதற்கு Claude அழைக்கும் ஒரு கருவியாகச் செயல்படுகிறது.

இதன் முடிவுகள் குறிப்பிடத்தக்கவை. 500 PDF கோப்புகளில் செய்யப்பட்ட ஒரு சோதனை, RAG layer-ஐப் பயன்படுத்துவது இந்தச் செயல்பாட்டை பின்வருமாறு மாற்றியமைத்தது என்பதைக் காட்டியது: • 4.2x வேகமானது. • 3.2x மலிவானது. • அதிக நம்பகமானது.

நேரடி கோப்புத் தேடலை (direct file search) எப்போது பயன்படுத்த வேண்டும்:

உங்கள் கோப்புகள் குறைவாக இருக்கும்போது (சில டஜன் குறைவானவை).
கோப்புகள் ஒவ்வொரு நிமிடமும் மாறிக் கொண்டிருக்கும்போது.
உங்களுக்கு விரைவான, ஆய்வுத் தேடல் (exploratory work) தேவைப்படும்போது.

RAG layer-ஐ எப்போது பயன்படுத்த வேண்டும்:

உங்கள் ஆவணங்களின் தொகுப்பு பெரியதாகவோ அல்லது வளர்ந்து கொண்டே இருந்தாலோ.
நீங்கள் அடிக்கடி ஒரே அறிவுத் தளத்தை (knowledge base) தேடுகிறீர்கள் என்றால்.
செலவு மற்றும் துல்லியம் ஆகியவை முன்னுரிமைகளாக இருக்கும்போது.

இதைச் செயல்படுத்த:

உங்கள் ஆவணங்களை முன்கூட்டியே index செய்யவும்.
பொருளைச் சிதைக்காமல் இருக்க semantic chunking-ஐப் பயன்படுத்தவும்.
ஒரு MCP server மூலம் index-ஐ வெளிப்படுத்தவும்.
பெறப்பட்ட துண்டுகளை (retrieved chunks) மட்டுமே பயன்படுத்தி பதிலளிக்குமாறு Claude-இடம் கூறவும்.

Architecture உங்கள் வேகத்தைத் தீர்மானிக்கிறது. சிறிய பணிகளுக்கு நேரடித் தேடலைப் பயன்படுத்தவும். பெரிய அளவிலான பணிகளுக்கு RAG-ஐப் பயன்படுத்தவும்.

ஆதாரம்: https://dev.to/benjamin_wallace_c431f902/how-to-make-claude-code-faster-for-large-document-search-1d1i

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi

பெரிய ஆவணத் தேடலுக்கு Claude Code-ஐ எவ்வாறு வேகப்படுத்துவது?

பெரிய ஆவணத் தேடலுக்கு Claude Code-ஐ எவ்வாறு வேகப்படுத்துவது?

Continue reading

CLAUDE.md-ஐ வெளிப்புறச் செயல்பாட்டு நினைவகமாகப் பயன்படுத்துங்கள்

RAG Chunking Strategies: Split Documents for Better Retrieval

உங்கள் உற்பத்தித்திறனை 10 மடங்கு அதிகரிக்க 17 Claude Code குறிப்புகள்