در مطلب قبل در مورد وب سرویس متن کاوی توضیح دادیم در مطلب بعد در مورد مستندات سرویس متن کاوی توضیح خواهیم داد.
شناسایی مرز جملات ساده
در این تابع شناسایی مرز جملات ساده/مرکب آن انجام میشود(مستندات سرویس متن کاوی ).
آدرس و نوع تابع وبسرویس
POST https://api.text-mining.ir/api/PreProcessing/SentenceSplitter
مدل دریافتی به عنوان پارامتر
عنوان مقدار پیشفرض توضیح پارامتر
text متن ورودی
checkSlang true آیا تبدیل محاوره ای به رسمی انجام شود
normalize true آیا نرمالسازی متن نیز انجام شود
normalizerParams پارامترهای نرمالسازی متن ورودی
complexSentence true آیا بخشهای جملات مرکب غیرتودرتو نیز جدا شوند
c#
string baseAddress = “https://api.text-mining.ir/api/”;
HttpClient client = new HttpClient();
client.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue(“Bearer”, GetJWTToken());
string inputText = “من با دوستم به مدرسه می رفتیم و در آنجا مشغول به تحصیل بودیم. سپس به دانشگاه راه یافتیم”;
string json = JsonConvert.SerializeObject(new
{
Text = inputText,
Normalize = true, // نرمالسازی نیز انجام شود
NormalizerParams = new // تنظیم پارامترهای نرمالسازی متن (اختیاری)
{
Text = “required but don’t care :)”,
RefineQuotationPunc = false
},
CheckSlang = true, // عملیات تبدیل متن محاورهای به رسمی نیز انجام شود
ComplexSentence = true // جملات مرکب (غیرتودرتو) نیز جدا شوند
});
var response = client.PostAsync(baseAddress + “PreProcessing/SentenceSplitter”, new StringContent(json, Encoding.UTF8, “application/json”)).Result;
string resp = response.Content.ReadAsStringAsync().Result;
var result = JsonConvert.DeserializeObject<List<string>>(resp);
Console.WriteLine(resp);
شناسایی مرز جملات و جداسازی کلمات
در این تابع شناسایی مرز جملات ساده/مرکب و جداسازی کلمات (توکنها) آن انجام میشود
آدرس و نوع تابع وبسرویس
POST https://api.text-mining.ir/api/PreProcessing/SentenceSplitterAndTokenize
مدل دریافتی به عنوان پارامتر
عنوان مقدار پیشفرض توضیح پارامتر
text متن ورودی
checkSlang true آیا تبدیل محاوره ای به رسمی انجام شود
normalize true آیا نرمالسازی متن نیز انجام شود
normalizerParams پارامترهای نرمالسازی متن ورودی
complexSentence true آیا بخشهای جملات مرکب غیرتودرتو نیز جدا شوند
string baseAddress = “https://api.text-mining.ir/api/”;
HttpClient client = new HttpClient();
client.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue(“Bearer”, GetJWTToken());
string inputText = “من با دوستم به مدرسه می رفتیم و در آنجا مشغول به تحصیل بودیم. سپس به دانشگاه راه یافتیم”;
string json = JsonConvert.SerializeObject(new
{
Text = inputText,
Normalize = true, // نرمالسازی نیز انجام شود
NormalizerParams = new // تنظیم پارامترهای نرمالسازی متن (اختیاری)
{
Text = “required but don’t care :)”,
RefineQuotationPunc = false
},
CheckSlang = true, // عملیات تبدیل متن محاورهای به رسمی نیز انجام شود
ComplexSentence = true // جملات مرکب (غیرتودرتو) نیز جدا شوند
});
var response = client.PostAsync(baseAddress + “PreProcessing/SentenceSplitterAndTokenize”, new StringContent(json, Encoding.UTF8, “application/json”)).Result;
string resp = response.Content.ReadAsStringAsync().Result;
خروجی مثال کد بالا: [[“من”,“با”,“دوستم”,“به”,“مدرسه”,“میرفتیم”],[“و”,“در”,“آنجا”,“مشغول”,“به”,“تحصیل”,“بودیم”,“.”],[“سپس”,“به”,“دانشگاه”,“راه”,“یافتیم”]]
جداسازی توکنهای متن
در این تابع شناسایی مرز جملات ساده/مرکب آن انجام میشود
آدرس و نوع تابع وبسرویس
POST https://api.text-mining.ir/api/PreProcessing/Tokenize
مدل دریافتی به عنوان پارامتر
عنوان مقدار پیشفرض توضیح پارامتر
inputText متن ورودی
c#
string baseAddress = “https://api.text-mining.ir/api/”;
HttpClient client = new HttpClient();
client.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue(“Bearer”, GetJWTToken());
string inputText = “من با دوستم به مدرسه می رفتیم و در آنجا مشغول به تحصیل بودیم… سپس به دانشگاه راه یافتیم”;
string json = JsonConvert.SerializeObject(inputText);
var response = client.PostAsync(baseAddress + “PreProcessing/Tokenize”, new StringContent(json, Encoding.UTF8, “application/json”)).Result;
string resp = response.Content.ReadAsStringAsync().Result;
var result = JsonConvert.DeserializeObject<List<string>>(resp);
Console.WriteLine(resp);
خروجی مثال کد بالا: [“من”,“با”,“دوستم”,“به”,“مدرسه”,“می”,“رفتیم”,“و”,“در”,“آنجا”,“مشغول”,“به”,“تحصیل”,“بودیم”,“…”,“سپس”,“به”,“دانشگاه”,“راه”,“یافتیم”]
در این مطلب در مورد مستندات سرویس متن کاوی توضیح دادیم در مطلب بعد در مورد ادامه مستندات وب سرویس متن کاوی توضیح خواهیم داد