Documentation ¶
Index ¶
- Variables
- func ChangeFileCoding2GBK(inBytes []byte) ([]byte, error)
- func ChangeFileCoding2UTF8(inBytes []byte) ([]byte, error)
- func ChineseString2Lang(chineseStr string) language.MyLanguage
- func ConvertToString(log *logrus.Logger, src string, srcCode string, tagCode string) string
- func DetectSubLangAndStatistics(oneDialogue subparser.OneDialogue, langDict map[int]int, ...) int
- func GetLangOptions() whatlanggo.Options
- func HasChineseLang(lan language.MyLanguage) bool
- func ISOString2SupportLang(isoString string) language2.MyLanguage
- func ISOSupportRegexRule() string
- func IsBilingualSubtitle(lan language.MyLanguage) bool
- func IsSupportISOChineseString(isoString string) bool
- func IsSupportISOString(isoString string) bool
- func IsWhiteListLang(lang whatlanggo.Lang) bool
- func Lang2ChineseString(lan language.MyLanguage) string
- func LangConverter4Sub_Supplier(subLang string) language.MyLanguage
- func MyLang2ChineseISO(myLanguage language2.MyLanguage) string
- func MyLang2ISO_639_1_String(myLanguage language2.MyLanguage) string
- func SubLangStatistics2SubLangType(countLineFeed, AllLines float32, langDict map[int]int, chLines []string) language.MyLanguage
- func WhichChineseType(inputString string) int
Constants ¶
This section is empty.
Variables ¶
var (
ChDict = sat.DefaultDict()
)
Functions ¶
func ChangeFileCoding2GBK ¶
func ChangeFileCoding2UTF8 ¶
ChangeFileCoding2UTF8 自动检测文件的编码,然后转换到 UTF-8,但是导出 bytes 的时候会把头部的 BOM 信息去除
func ChineseString2Lang ¶
func ChineseString2Lang(chineseStr string) language.MyLanguage
ChineseString2Lang 将 中文描述:简、繁、简英 转换为 types.MyLanguage 支持的字符串语言见 internal/types/language/my_language.go
func ConvertToString ¶
ConvertToString 将字符串从原始编码转换到目标编码,需要配合字符串检测编码库使用 chardet.NewTextDetector()
func DetectSubLangAndStatistics ¶
func DetectSubLangAndStatistics(oneDialogue subparser.OneDialogue, langDict map[int]int, usefulDialogueEx *[]subparser.OneDialogueEx, chLines *[]string, otherLines *[]string) int
DetectSubLangAndStatistics 检测语言然后统计
func GetLangOptions ¶
func GetLangOptions() whatlanggo.Options
GetLangOptions 语言识别的 Options Whitelist
func ISOString2SupportLang ¶
func ISOString2SupportLang(isoString string) language2.MyLanguage
ISOString2SupportLang 从语言缩写字符串转换为内部的 MyLanguage 类型 1. 支持 ISO 639-1、639-2/B、639-2/T、639-3 2. 支持中文的多种变种编码 https://en.wikipedia.org/wiki/List_of_ISO_639-1_codes
func ISOSupportRegexRule ¶
func ISOSupportRegexRule() string
ISOSupportRegexRule 获取 ISO 匹配的 regex 表达式
func IsBilingualSubtitle ¶
func IsBilingualSubtitle(lan language.MyLanguage) bool
IsBilingualSubtitle 是否是双语字幕
func IsSupportISOChineseString ¶
IsSupportISOChineseString 是否是受支持的语言,中 1. 支持 ISO 639-1、639-2/B、639-2/T、639-3 2. 支持中文的多种变种编码
func IsSupportISOString ¶
IsSupportISOString 是否是受支持的语言,中、英、日、韩 1. 支持 ISO 639-1、639-2/B、639-2/T、639-3 2. 支持中文的多种变种编码
func Lang2ChineseString ¶
func Lang2ChineseString(lan language.MyLanguage) string
Lang2ChineseString 将 types.MyLanguage 转换为中文描述:简、繁、简英 支持的字符串语言见 internal/types/language/my_language.go
func LangConverter4Sub_Supplier ¶
func LangConverter4Sub_Supplier(subLang string) language.MyLanguage
LangConverter4Sub_Supplier 语言转换器,给字幕的提供者实例解析使用(xunlei、zimuku等) 支持的字符串语言见 internal/types/language/my_language.go
func MyLang2ChineseISO ¶
func MyLang2ChineseISO(myLanguage language2.MyLanguage) string
MyLang2ChineseISO 中文语言编码变种,见 ISOLanguage.go 文件,这里区分简体、繁体等,如果语言是非中文则这里是空
func MyLang2ISO_639_1_String ¶
func MyLang2ISO_639_1_String(myLanguage language2.MyLanguage) string
MyLang2ISO_639_1_String 内置的语言转换到 ISO_639-1_codes 标准
func SubLangStatistics2SubLangType ¶
func SubLangStatistics2SubLangType(countLineFeed, AllLines float32, langDict map[int]int, chLines []string) language.MyLanguage
SubLangStatistics2SubLangType 由分析的信息转换为具体是什么字幕的语言类型
func WhichChineseType ¶
WhichChineseType 是简体中文(1)还是繁体中文(2),如果都不是,那么是 0
Types ¶
This section is empty.