ar

package

v0.1.1 Latest Latest Go to latest Published: Sep 29, 2020 License: Apache-2.0 Imports: 5 Imported by: 4

Details

Valid go.mod file

The Go module system was introduced in Go 1.11 and is the official dependency management solution for Go.
Redistributable license

Redistributable licenses place minimal restrictions on how software can be used, modified, and redistributed.
Tagged version

Modules with tagged versions give importers more predictable builds.
Stable version

When a project reaches major version v1 it is considered stable.
Learn more about best practices

Repository

github.com/blugelabs/bluge

Links

Open Source Insights

Documentation ¶

Index ¶

Constants
Variables
func Analyzer() *analysis.Analyzer
func StopWords() analysis.TokenMap
func StopWordsFilter() *token.StopTokensFilter
type ArabicNormalizeFilter
- func NormalizeFilter() *ArabicNormalizeFilter
- func (s *ArabicNormalizeFilter) Filter(input analysis.TokenStream) analysis.TokenStream
type ArabicStemmerFilter
- func StemmerFilter() *ArabicStemmerFilter
- func (s *ArabicStemmerFilter) Filter(input analysis.TokenStream) analysis.TokenStream

Constants ¶

View Source

const (
	Alef           = '\u0627'
	AlefMadda      = '\u0622'
	AlefHamzaAbove = '\u0623'
	AlefHamzaBelow = '\u0625'
	Yeh            = '\u064A'
	DotlessYeh     = '\u0649'
	TehMarbuta     = '\u0629'
	Heh            = '\u0647'
	Tatweel        = '\u0640'
	Fathatan       = '\u064B'
	Dammatan       = '\u064C'
	Kasratan       = '\u064D'
	Fatha          = '\u064E'
	Damma          = '\u064F'
	Kasra          = '\u0650'
	Shadda         = '\u0651'
	Sukun          = '\u0652'
)

Variables ¶

View Source

var StopWordsBytes = []byte(`# This file was created by Jacques Savoy and is distributed under the BSD license.
# See http://members.unine.ch/jacques.savoy/clef/index.html.
# Also see http://www.opensource.org/licenses/bsd-license.html
# Cleaned on October 11, 2009 (not normalized, so use before normalization)
# This means that when modifying this list, you might need to add some 
# redundant entries, for example containing forms with both أ and ا
من
ومن
منها
منه
في
وفي
فيها
فيه
و
ف
ثم
او
أو
ب
بها
به
ا
أ
اى
اي
أي
أى
لا
ولا
الا
ألا
إلا
لكن
ما
وما
كما
فما
عن
مع
اذا
إذا
ان
أن
إن
انها
أنها
إنها
انه
أنه
إنه
بان
بأن
فان
فأن
وان
وأن
وإن
التى
التي
الذى
الذي
الذين
الى
الي
إلى
إلي
على
عليها
عليه
اما
أما
إما
ايضا
أيضا
كل
وكل
لم
ولم
لن
ولن
هى
هي
هو
وهى
وهي
وهو
فهى
فهي
فهو
انت
أنت
لك
لها
له
هذه
هذا
تلك
ذلك
هناك
كانت
كان
يكون
تكون
وكانت
وكان
غير
بعض
قد
نحو
بين
بينما
منذ
ضمن
حيث
الان
الآن
خلال
بعد
قبل
حتى
عند
عندما
لدى
جميع
`)

Functions ¶

func Analyzer ¶

func Analyzer() *analysis.Analyzer

func StopWords ¶

func StopWords() analysis.TokenMap

func StopWordsFilter ¶

func StopWordsFilter() *token.StopTokensFilter

Types ¶

type ArabicNormalizeFilter ¶

type ArabicNormalizeFilter struct {
}

func NormalizeFilter ¶

func NormalizeFilter() *ArabicNormalizeFilter

func (*ArabicNormalizeFilter) Filter ¶

func (s *ArabicNormalizeFilter) Filter(input analysis.TokenStream) analysis.TokenStream

type ArabicStemmerFilter ¶

type ArabicStemmerFilter struct{}

func StemmerFilter ¶

func StemmerFilter() *ArabicStemmerFilter

func (*ArabicStemmerFilter) Filter ¶

func (s *ArabicStemmerFilter) Filter(input analysis.TokenStream) analysis.TokenStream

Source Files ¶

View all Source files

?	: This menu
/	: Search site
f or F	: Jump to
y or Y	: Canonical URL