Documentation ¶
Index ¶
- type AnalysisInfo
- type AnalysisInfoChannel
- type AnalysisInfoChannelEnum
- type AnalysisInfoResult
- type AudioConfig
- type AudioConfigAudioFormat
- type AudioConfigAudioFormatEnum
- type AudioConfigLanguage
- type AudioConfigLanguageEnum
- type AudioConfigMode
- type AudioConfigModeEnum
- type CollectTranscriberJobRequest
- type CollectTranscriberJobResponse
- type Config
- type ConfigAddPunc
- type ConfigAddPuncEnum
- type ConfigAudioFormat
- type ConfigAudioFormatEnum
- type ConfigDigitNorm
- type ConfigDigitNormEnum
- type ConfigNeedWordInfo
- type ConfigNeedWordInfoEnum
- type ConfigProperty
- type ConfigPropertyEnum
- type CreateVocabularyRequest
- type CreateVocabularyResponse
- type CustomResult
- type DeleteVocabularyRequest
- type DeleteVocabularyResponse
- type FlashResult
- type FlashScoreResult
- type Fluency
- type MultiModalConfig
- type MultiModalConfigLanguage
- type MultiModalConfigLanguageEnum
- type MultiModalConfigMode
- type MultiModalConfigModeEnum
- type MultiModalConfigVideoFormat
- type MultiModalConfigVideoFormatEnum
- type Phoneme
- type PhonemeFluency
- type PhonemePronunciation
- type PostCreateVocabReq
- type PostCreateVocabReqLanguage
- type PostCreateVocabReqLanguageEnum
- type PostCustomTtsReq
- type PostMultiModalAssessmentReq
- type PostShortAudioAssessmentReq
- type PostShortAudioReq
- type PostTranscriberJobs
- type Pronunciation
- type PushTranscriberJobsRequest
- type PushTranscriberJobsResponse
- type PutUpdateVocabReq
- type PutUpdateVocabReqLanguage
- type PutUpdateVocabReqLanguageEnum
- type RecognizeFlashAsrRequest
- type RecognizeFlashAsrRequestAddPunc
- type RecognizeFlashAsrRequestAddPuncEnum
- type RecognizeFlashAsrRequestAudioFormat
- type RecognizeFlashAsrRequestAudioFormatEnum
- type RecognizeFlashAsrRequestDigitNorm
- type RecognizeFlashAsrRequestDigitNormEnum
- type RecognizeFlashAsrRequestFirstChannelOnly
- type RecognizeFlashAsrRequestFirstChannelOnlyEnum
- type RecognizeFlashAsrRequestNeedWordInfo
- type RecognizeFlashAsrRequestNeedWordInfoEnum
- type RecognizeFlashAsrRequestProperty
- type RecognizeFlashAsrRequestPropertyEnum
- type RecognizeFlashAsrResponse
- type RecognizeShortAudioRequest
- type RecognizeShortAudioResponse
- type Result
- type RunAudioAssessmentRequest
- type RunAudioAssessmentResponse
- type RunMultiModalAssessmentRequest
- type RunMultiModalAssessmentResponse
- type RunTtsRequest
- type RunTtsResponse
- type Segment
- type Sentences
- type ShowVocabulariesParams
- type ShowVocabulariesRequest
- type ShowVocabulariesResponse
- type ShowVocabularyRequest
- type ShowVocabularyResponse
- type ShowVocabularyResponseLanguage
- type ShowVocabularyResponseLanguageEnum
- type TranscriberConfig
- type TranscriberConfigAddPunc
- type TranscriberConfigAddPuncEnum
- type TranscriberConfigAudioFormat
- type TranscriberConfigAudioFormatEnum
- type TranscriberConfigDigitNorm
- type TranscriberConfigDigitNormEnum
- type TranscriberConfigNeedWordInfo
- type TranscriberConfigNeedWordInfoEnum
- type TranscriberConfigProperty
- type TranscriberConfigPropertyEnum
- type TranscriberResult
- type TtsConfig
- type TtsConfigAudioFormat
- type TtsConfigAudioFormatEnum
- type TtsConfigProperty
- type TtsConfigPropertyEnum
- type TtsConfigSampleRate
- type TtsConfigSampleRateEnum
- type UpdateVocabularyRequest
- type UpdateVocabularyResponse
- type VocabInfo
- type VocabInfoLanguage
- type VocabInfoLanguageEnum
- type Word
- type WordFluency
- type WordInfo
- type WordPronunciation
Constants ¶
This section is empty.
Variables ¶
This section is empty.
Functions ¶
This section is empty.
Types ¶
type AnalysisInfo ¶
type AnalysisInfo struct { // 是否需要做话者分离。缺省为true,表示会进行话者分离,识别结果中会包含role项(角色)。如果diarization为false, 那么结果中不会出现role项。 Diarization *bool `json:"diarization,omitempty"` // 语音文件声道信息,可以为MONO(缺省), LEFT_AGENT, RIGHT_AGENT。 如果channel 为MONO,那么原始文件需要为单声道文件。 如果为双声道文件,系统会将其转换成单声道文件,可能会影响识别效果。 如果 channel 为 LEFT_AGENT或RIGHT_AGENT, 则原始文件需要为双声道文件,如果为单声道文件,系统会将其转换成双声道文件,可能会影响识别效果。 当channel 为 LEFT_AGENT或RIGHT_AGENT,且diarization为true时,系统会按照配置给出对应角色。其中: LEFT_AGENT 指定左声道语音为agent(坐席), RIGHT_AGENT 指定右声道为agent(坐席)。 Channel *AnalysisInfoChannel `json:"channel,omitempty"` // 是否需要做情绪检测, 缺省为true。 Emotion *bool `json:"emotion,omitempty"` // 是否需要输出语速信息, 缺省为true。 Speed *bool `json:"speed,omitempty"` }
func (AnalysisInfo) String ¶
func (o AnalysisInfo) String() string
type AnalysisInfoChannel ¶
type AnalysisInfoChannel struct {
// contains filtered or unexported fields
}
func (AnalysisInfoChannel) MarshalJSON ¶
func (c AnalysisInfoChannel) MarshalJSON() ([]byte, error)
func (*AnalysisInfoChannel) UnmarshalJSON ¶
func (c *AnalysisInfoChannel) UnmarshalJSON(b []byte) error
func (AnalysisInfoChannel) Value ¶ added in v0.0.90
func (c AnalysisInfoChannel) Value() string
type AnalysisInfoChannelEnum ¶
type AnalysisInfoChannelEnum struct { MONO AnalysisInfoChannel LEFT_AGENT AnalysisInfoChannel RIGHT_AGENT AnalysisInfoChannel }
func GetAnalysisInfoChannelEnum ¶
func GetAnalysisInfoChannelEnum() AnalysisInfoChannelEnum
type AnalysisInfoResult ¶
type AnalysisInfoResult struct { // 角色类型, 目前仅支持 AGENT(座席), USER(用户)。 Role *string `json:"role,omitempty"` // 情绪类型,目前支持NORMAL(正常),ANGRY(愤怒),UNKNOWN(未知)。 在识别配置中emotion为true时存在。 Emotion *string `json:"emotion,omitempty"` // 语速信息,单位是\"每秒字数\"。 在识别配置中speed为true时存在。 Speed *float32 `json:"speed,omitempty"` }
func (AnalysisInfoResult) String ¶
func (o AnalysisInfoResult) String() string
type AudioConfig ¶
type AudioConfig struct { // 语音的格式。不填写此字段,则默认为auto。注意音频不论何种格式,均要求采样率在16000Hz以上。 auto 自动判断,系统会自动判断并支持WAV(内部支持pcm/ulaw/alaw编码格式)、MP3、M4A、ogg-opus、AMR等格式。推荐使用此取值。 wav wav格式。 aac aac格式。 mp3 mp3格式。 amr amr格式。 m4a m4a格式。 opus ogg-opus格式。 AudioFormat *AudioConfigAudioFormat `json:"audio_format,omitempty"` // 评测语言 en_gb 英语-英式口音。 Language AudioConfigLanguage `json:"language"` // 评测模式 word 单词模式 sentence 句子模式 Mode AudioConfigMode `json:"mode"` }
func (AudioConfig) String ¶
func (o AudioConfig) String() string
type AudioConfigAudioFormat ¶
type AudioConfigAudioFormat struct {
// contains filtered or unexported fields
}
func (AudioConfigAudioFormat) MarshalJSON ¶
func (c AudioConfigAudioFormat) MarshalJSON() ([]byte, error)
func (*AudioConfigAudioFormat) UnmarshalJSON ¶
func (c *AudioConfigAudioFormat) UnmarshalJSON(b []byte) error
func (AudioConfigAudioFormat) Value ¶ added in v0.0.90
func (c AudioConfigAudioFormat) Value() string
type AudioConfigAudioFormatEnum ¶
type AudioConfigAudioFormatEnum struct { AUTO AudioConfigAudioFormat WAV AudioConfigAudioFormat AAC AudioConfigAudioFormat MP3 AudioConfigAudioFormat AMR AudioConfigAudioFormat M4A AudioConfigAudioFormat OPUS AudioConfigAudioFormat }
func GetAudioConfigAudioFormatEnum ¶
func GetAudioConfigAudioFormatEnum() AudioConfigAudioFormatEnum
type AudioConfigLanguage ¶
type AudioConfigLanguage struct {
// contains filtered or unexported fields
}
func (AudioConfigLanguage) MarshalJSON ¶
func (c AudioConfigLanguage) MarshalJSON() ([]byte, error)
func (*AudioConfigLanguage) UnmarshalJSON ¶
func (c *AudioConfigLanguage) UnmarshalJSON(b []byte) error
func (AudioConfigLanguage) Value ¶ added in v0.0.90
func (c AudioConfigLanguage) Value() string
type AudioConfigLanguageEnum ¶
type AudioConfigLanguageEnum struct {
EN_GB AudioConfigLanguage
}
func GetAudioConfigLanguageEnum ¶
func GetAudioConfigLanguageEnum() AudioConfigLanguageEnum
type AudioConfigMode ¶
type AudioConfigMode struct {
// contains filtered or unexported fields
}
func (AudioConfigMode) MarshalJSON ¶
func (c AudioConfigMode) MarshalJSON() ([]byte, error)
func (*AudioConfigMode) UnmarshalJSON ¶
func (c *AudioConfigMode) UnmarshalJSON(b []byte) error
func (AudioConfigMode) Value ¶ added in v0.0.90
func (c AudioConfigMode) Value() string
type AudioConfigModeEnum ¶
type AudioConfigModeEnum struct { WORD AudioConfigMode SENTENCE AudioConfigMode }
func GetAudioConfigModeEnum ¶
func GetAudioConfigModeEnum() AudioConfigModeEnum
type CollectTranscriberJobRequest ¶
type CollectTranscriberJobRequest struct { // 录音文件识别任务标识符。 JobId string `json:"job_id"` }
Request Object
func (CollectTranscriberJobRequest) String ¶
func (o CollectTranscriberJobRequest) String() string
type CollectTranscriberJobResponse ¶
type CollectTranscriberJobResponse struct { // 当前识别状态。具体状态如下所示: WAITING 等待识别。 FINISHED 识别已经完成。 ERROR 识别过程中发生错误。 Status *string `json:"status,omitempty"` // 任务创建时间, 遵循 RFC 3339格式。 格式示例:2018-12-04T13:10:29.310Z。 CreateTime *string `json:"create_time,omitempty"` // 开始识别时间, 遵循 RFC 3339格式。 当status为FINISHED或ERROR时存在。 格式示例:2018-12-04T13:10:29.310Z。 StartTime *string `json:"start_time,omitempty"` // 识别完成时间, 遵循 RFC 3339格式。 当status为FINISHED或ERROR时存在。 格式示例:2018-12-04T13:10:29.310Z。 FinishTime *string `json:"finish_time,omitempty"` // 转写结果, 多句结果的数组。 Segments *[]Segment `json:"segments,omitempty"` // 音频时长,单位ms AudioDuration *int32 `json:"audio_duration,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (CollectTranscriberJobResponse) String ¶
func (o CollectTranscriberJobResponse) String() string
type Config ¶
type Config struct { // 支持语音的格式。 audio_format取值范围: pcm16k16bit 16k16bit单通道录音数据。 pcm8k16bit 8k16bit单通道录音数据。 ulaw16k8bit 16k8bit ulaw 单通道录音数据。 ulaw8k8bit 8k8bit ulaw 单通道录音数据。 alaw16k8bit 16k8bit alaw 单通道录音数据。 alaw8k8bit 8k8bit alaw 单通道录音数据。 mp3 mp3格式音频。目前仅支持单通道的音频。 aac aac格式音频。目前仅支持单通道的音频。 wav 带wav封装头的格式,从封装头中自动确定格式,目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式 amr AMR窄带(8k) 压缩录音数据。 amrwb AMR 宽带(16k) 压缩录音数据。 auto 由引擎自动判断音频数据的格式并解码,支持自动判断wav,mp3,amr/amrwb,aac,m4a,wma格式 AudioFormat ConfigAudioFormat `json:"audio_format"` // 所使用的模型特征串。通常是 “语种_采样率_领域”的形式。 采样率需要与音频采样率保持一致。 当前支持如下模型特征串: chinese_16k_general 支持采样率为16k的中文普通话语音识别,同时可识别一些简单的方言。格式仅支持pcm16k16bit、mp3、wav,区域仅支持cn-north-4。 chinese_16k_travel 支持采样率为16k的中文普通话语音识别,采用新一代端到端识别算法,并针对网约车质检场景进行了优化。格式仅支持pcm16k16bit、mp3、wav和aac,区域支持cn-east-3和cn-north-4(强烈推荐使用)。 chinese_8k_common 支持采样率为8k的中文普通话语音识别。 chinese_16k_common 支持采样率为16k的中文普通话语音识别。 sichuan_16k_common 支持采样率为16k的中文普通话与四川话方言识别。区域仅支持cn-north-4。 cantonese_16k_common 支持采样率为16k的粤语方言识别。区域仅支持cn-north-4。 shanghai_16k_common 支持采样率为16k的上海话方言识别,区域仅支持cn-north-4。 Property ConfigProperty `json:"property"` // 表示是否在识别结果中添加标点,取值为“yes”和“no”,缺省为“no”。 AddPunc *ConfigAddPunc `json:"add_punc,omitempty"` // 热词表id,不使用则不填写。 VocabularyId *string `json:"vocabulary_id,omitempty"` // 表示是否将语音中的数字识别为阿拉伯数字,取值为“yes” 和 “no”,缺省为“yes”。 DigitNorm *ConfigDigitNorm `json:"digit_norm,omitempty"` // 表示是否在识别结果中输出分词结果信息,取值为“yes”和“no”,默认为“no”。 NeedWordInfo *ConfigNeedWordInfo `json:"need_word_info,omitempty"` }
type ConfigAddPunc ¶
type ConfigAddPunc struct {
// contains filtered or unexported fields
}
func (ConfigAddPunc) MarshalJSON ¶
func (c ConfigAddPunc) MarshalJSON() ([]byte, error)
func (*ConfigAddPunc) UnmarshalJSON ¶
func (c *ConfigAddPunc) UnmarshalJSON(b []byte) error
func (ConfigAddPunc) Value ¶ added in v0.0.90
func (c ConfigAddPunc) Value() string
type ConfigAddPuncEnum ¶
type ConfigAddPuncEnum struct { YES ConfigAddPunc NO ConfigAddPunc }
func GetConfigAddPuncEnum ¶
func GetConfigAddPuncEnum() ConfigAddPuncEnum
type ConfigAudioFormat ¶
type ConfigAudioFormat struct {
// contains filtered or unexported fields
}
func (ConfigAudioFormat) MarshalJSON ¶
func (c ConfigAudioFormat) MarshalJSON() ([]byte, error)
func (*ConfigAudioFormat) UnmarshalJSON ¶
func (c *ConfigAudioFormat) UnmarshalJSON(b []byte) error
func (ConfigAudioFormat) Value ¶ added in v0.0.90
func (c ConfigAudioFormat) Value() string
type ConfigAudioFormatEnum ¶
type ConfigAudioFormatEnum struct { PCM16K16BIT ConfigAudioFormat PCM8K16BIT ConfigAudioFormat ULAW16K8BIT ConfigAudioFormat ULAW8K8BIT ConfigAudioFormat ALAW16K8BIT ConfigAudioFormat ALAW8K8BIT ConfigAudioFormat MP3 ConfigAudioFormat AAC ConfigAudioFormat WAV ConfigAudioFormat AMR ConfigAudioFormat AMRWB ConfigAudioFormat AUTO ConfigAudioFormat }
func GetConfigAudioFormatEnum ¶
func GetConfigAudioFormatEnum() ConfigAudioFormatEnum
type ConfigDigitNorm ¶
type ConfigDigitNorm struct {
// contains filtered or unexported fields
}
func (ConfigDigitNorm) MarshalJSON ¶
func (c ConfigDigitNorm) MarshalJSON() ([]byte, error)
func (*ConfigDigitNorm) UnmarshalJSON ¶
func (c *ConfigDigitNorm) UnmarshalJSON(b []byte) error
func (ConfigDigitNorm) Value ¶ added in v0.0.90
func (c ConfigDigitNorm) Value() string
type ConfigDigitNormEnum ¶
type ConfigDigitNormEnum struct { YES ConfigDigitNorm NO ConfigDigitNorm }
func GetConfigDigitNormEnum ¶
func GetConfigDigitNormEnum() ConfigDigitNormEnum
type ConfigNeedWordInfo ¶
type ConfigNeedWordInfo struct {
// contains filtered or unexported fields
}
func (ConfigNeedWordInfo) MarshalJSON ¶
func (c ConfigNeedWordInfo) MarshalJSON() ([]byte, error)
func (*ConfigNeedWordInfo) UnmarshalJSON ¶
func (c *ConfigNeedWordInfo) UnmarshalJSON(b []byte) error
func (ConfigNeedWordInfo) Value ¶ added in v0.0.90
func (c ConfigNeedWordInfo) Value() string
type ConfigNeedWordInfoEnum ¶
type ConfigNeedWordInfoEnum struct { YES ConfigNeedWordInfo NO ConfigNeedWordInfo }
func GetConfigNeedWordInfoEnum ¶
func GetConfigNeedWordInfoEnum() ConfigNeedWordInfoEnum
type ConfigProperty ¶
type ConfigProperty struct {
// contains filtered or unexported fields
}
func (ConfigProperty) MarshalJSON ¶
func (c ConfigProperty) MarshalJSON() ([]byte, error)
func (*ConfigProperty) UnmarshalJSON ¶
func (c *ConfigProperty) UnmarshalJSON(b []byte) error
func (ConfigProperty) Value ¶ added in v0.0.90
func (c ConfigProperty) Value() string
type ConfigPropertyEnum ¶
type ConfigPropertyEnum struct { CHINESE_16K_GENERAL ConfigProperty CHINESE_16K_TRAVEL ConfigProperty CHINESE_8K_COMMON ConfigProperty CHINESE_16K_COMMON ConfigProperty SICHUAN_16K_COMMON ConfigProperty CANTONESE_16K_COMMON ConfigProperty SHANGHAI_16K_COMMON ConfigProperty }
func GetConfigPropertyEnum ¶
func GetConfigPropertyEnum() ConfigPropertyEnum
type CreateVocabularyRequest ¶
type CreateVocabularyRequest struct {
Body *PostCreateVocabReq `json:"body,omitempty"`
}
Request Object
func (CreateVocabularyRequest) String ¶
func (o CreateVocabularyRequest) String() string
type CreateVocabularyResponse ¶
type CreateVocabularyResponse struct { // 调用成功返回热词表ID,调用失败时无此字段。 VocabularyId *string `json:"vocabulary_id,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (CreateVocabularyResponse) String ¶
func (o CreateVocabularyResponse) String() string
type CustomResult ¶
type CustomResult struct { // 语音数据, Base64编码格式返回。 Data string `json:"data"` }
调用成功表示识别结果,调用失败时无此字段。
func (CustomResult) String ¶
func (o CustomResult) String() string
type DeleteVocabularyRequest ¶
type DeleteVocabularyRequest struct { // 热词表id。 VocabularyId string `json:"vocabulary_id"` }
Request Object
func (DeleteVocabularyRequest) String ¶
func (o DeleteVocabularyRequest) String() string
type DeleteVocabularyResponse ¶
type DeleteVocabularyResponse struct {
HttpStatusCode int `json:"-"`
}
Response Object
func (DeleteVocabularyResponse) String ¶
func (o DeleteVocabularyResponse) String() string
type FlashResult ¶
type FlashResult struct { // 音频声道id ChannelId *int32 `json:"channel_id,omitempty"` // 分句结果 Sentences *[]Sentences `json:"sentences,omitempty"` }
func (FlashResult) String ¶
func (o FlashResult) String() string
type FlashScoreResult ¶
type FlashScoreResult struct { // 调用成功表示识别出的内容。 Text string `json:"text"` // 调用成功表示识别出的置信度,取值范围:0~1。 Score float64 `json:"score"` // 分词信息列表 WordInfo *[]WordInfo `json:"word_info,omitempty"` }
func (FlashScoreResult) String ¶
func (o FlashScoreResult) String() string
type Fluency ¶
type Fluency struct { // 流利度综合得分 0-100 Score float32 `json:"score"` // 韵律得分 0-100 韵律指音素在单词和句子中的发音长度是否得当 Rhythm float32 `json:"rhythm"` // 连贯性得分 0-100 Cohesion float32 `json:"cohesion"` }
整体流利度打分
type MultiModalConfig ¶
type MultiModalConfig struct { // 视频的封装格式。不填写此字段,则默认为auto。注意不论何种格式,均要求帧率在25fps以上,清晰度在240*240以上。 auto 自动判断,系统会自动判断视频封装格式。 avi avi封装格式。 mp4 mp4封装格式。 webm webm封装格式。 mkv mkv封装格式。 flv flv封装格式。 VideoFormat *MultiModalConfigVideoFormat `json:"video_format,omitempty"` // 评测语言和口音。 en_gb 英语-英式口音。 Language MultiModalConfigLanguage `json:"language"` // 评测模式。 word 单词模式。 sentence 句子模式。 Mode MultiModalConfigMode `json:"mode"` }
多模态评测的配置
func (MultiModalConfig) String ¶
func (o MultiModalConfig) String() string
type MultiModalConfigLanguage ¶
type MultiModalConfigLanguage struct {
// contains filtered or unexported fields
}
func (MultiModalConfigLanguage) MarshalJSON ¶
func (c MultiModalConfigLanguage) MarshalJSON() ([]byte, error)
func (*MultiModalConfigLanguage) UnmarshalJSON ¶
func (c *MultiModalConfigLanguage) UnmarshalJSON(b []byte) error
func (MultiModalConfigLanguage) Value ¶ added in v0.0.90
func (c MultiModalConfigLanguage) Value() string
type MultiModalConfigLanguageEnum ¶
type MultiModalConfigLanguageEnum struct {
EN_GB MultiModalConfigLanguage
}
func GetMultiModalConfigLanguageEnum ¶
func GetMultiModalConfigLanguageEnum() MultiModalConfigLanguageEnum
type MultiModalConfigMode ¶
type MultiModalConfigMode struct {
// contains filtered or unexported fields
}
func (MultiModalConfigMode) MarshalJSON ¶
func (c MultiModalConfigMode) MarshalJSON() ([]byte, error)
func (*MultiModalConfigMode) UnmarshalJSON ¶
func (c *MultiModalConfigMode) UnmarshalJSON(b []byte) error
func (MultiModalConfigMode) Value ¶ added in v0.0.90
func (c MultiModalConfigMode) Value() string
type MultiModalConfigModeEnum ¶
type MultiModalConfigModeEnum struct { WORD MultiModalConfigMode SENTENCE MultiModalConfigMode }
func GetMultiModalConfigModeEnum ¶
func GetMultiModalConfigModeEnum() MultiModalConfigModeEnum
type MultiModalConfigVideoFormat ¶
type MultiModalConfigVideoFormat struct {
// contains filtered or unexported fields
}
func (MultiModalConfigVideoFormat) MarshalJSON ¶
func (c MultiModalConfigVideoFormat) MarshalJSON() ([]byte, error)
func (*MultiModalConfigVideoFormat) UnmarshalJSON ¶
func (c *MultiModalConfigVideoFormat) UnmarshalJSON(b []byte) error
func (MultiModalConfigVideoFormat) Value ¶ added in v0.0.90
func (c MultiModalConfigVideoFormat) Value() string
type MultiModalConfigVideoFormatEnum ¶
type MultiModalConfigVideoFormatEnum struct { AUTO MultiModalConfigVideoFormat AVI MultiModalConfigVideoFormat MP4 MultiModalConfigVideoFormat WEBM MultiModalConfigVideoFormat MKV MultiModalConfigVideoFormat FLV MultiModalConfigVideoFormat }
func GetMultiModalConfigVideoFormatEnum ¶
func GetMultiModalConfigVideoFormatEnum() MultiModalConfigVideoFormatEnum
type Phoneme ¶
type Phoneme struct { // 音标(ARPAbet音标系统) Arpa string `json:"arpa"` // 音标(国际音标系统) Ipa string `json:"ipa"` // StartTime float32 `json:"start_time"` // EndTime float32 `json:"end_time"` Fluency *PhonemeFluency `json:"fluency"` Pronunciation *PhonemePronunciation `json:"pronunciation"` }
单个音素的发音评测结果
type PhonemeFluency ¶
音素的流利度打分
func (PhonemeFluency) String ¶
func (o PhonemeFluency) String() string
type PhonemePronunciation ¶
音素的发音打分
func (PhonemePronunciation) String ¶
func (o PhonemePronunciation) String() string
type PostCreateVocabReq ¶
type PostCreateVocabReq struct { // 热词表名,不可重复。内容限制为字母,数字,下中划线和井号,长度不超过32字节。 Name string `json:"name"` // 热词表描述,长度不超过255字节。 Description *string `json:"description,omitempty"` // 热词表语言类型。 language取值范围: chinese_mandarin 汉语普通话 Language PostCreateVocabReqLanguage `json:"language"` // 支持中英混编热词,单个热词只能由英文字母和unicode编码的汉字组成,不能有其他符号,包括空格。 阿拉伯数字需写成汉字或英文(如“一”、“one”)。 单词库支持热词数上限1024。 单个热词长度上限32字节。 Contents []string `json:"contents"` }
func (PostCreateVocabReq) String ¶
func (o PostCreateVocabReq) String() string
type PostCreateVocabReqLanguage ¶
type PostCreateVocabReqLanguage struct {
// contains filtered or unexported fields
}
func (PostCreateVocabReqLanguage) MarshalJSON ¶
func (c PostCreateVocabReqLanguage) MarshalJSON() ([]byte, error)
func (*PostCreateVocabReqLanguage) UnmarshalJSON ¶
func (c *PostCreateVocabReqLanguage) UnmarshalJSON(b []byte) error
func (PostCreateVocabReqLanguage) Value ¶ added in v0.0.90
func (c PostCreateVocabReqLanguage) Value() string
type PostCreateVocabReqLanguageEnum ¶
type PostCreateVocabReqLanguageEnum struct {
CHINESE_MANDARIN PostCreateVocabReqLanguage
}
func GetPostCreateVocabReqLanguageEnum ¶
func GetPostCreateVocabReqLanguageEnum() PostCreateVocabReqLanguageEnum
type PostCustomTtsReq ¶
type PostCustomTtsReq struct { // 待合成的文本,文本长度限制小于500字符。 Text string `json:"text"` Config *TtsConfig `json:"config,omitempty"` }
func (PostCustomTtsReq) String ¶
func (o PostCustomTtsReq) String() string
type PostMultiModalAssessmentReq ¶
type PostMultiModalAssessmentReq struct { Config *MultiModalConfig `json:"config"` // 视频数据,Base64编码,要求Base64编码后大小不超过10M。 注意评测接口使用次数定义为:每8秒的视频作为一次,不足8秒按一次计算。例如传入4秒或8秒的视频,都算作使用一次,传入9秒的视频则视为调用2次。 VideoData string `json:"video_data"` // 被评估视频和语音数据对应的试题文本,长度不可超过256字节。 RefText string `json:"ref_text"` }
func (PostMultiModalAssessmentReq) String ¶
func (o PostMultiModalAssessmentReq) String() string
type PostShortAudioAssessmentReq ¶
type PostShortAudioAssessmentReq struct { Config *AudioConfig `json:"config"` // 语音数据,Base64编码,要求Base64编码后大小不超过1M。 注意评测接口使用次数定义为:每8秒的音频作为一次,不足8秒按一次计算。例如传入4秒或8秒的音频,都算作使用一次,传入9秒的音频则视为调用2次。 AudioData string `json:"audio_data"` // 评测文本 RefText string `json:"ref_text"` }
func (PostShortAudioAssessmentReq) String ¶
func (o PostShortAudioAssessmentReq) String() string
type PostShortAudioReq ¶
type PostShortAudioReq struct { Config *Config `json:"config"` // 语音数据,base64编码,要求base64编码后大小不超过4M,音频时长不超过1分钟。 Data string `json:"data"` }
func (PostShortAudioReq) String ¶
func (o PostShortAudioReq) String() string
type PostTranscriberJobs ¶
type PostTranscriberJobs struct { Config *TranscriberConfig `json:"config"` // 存放在OBS的音频文件路径。OBS的region要和请求服务的region保持一致,region不一致则OBS不可用,即使obs是公开访问权限。 DataUrl string `json:"data_url"` }
func (PostTranscriberJobs) String ¶
func (o PostTranscriberJobs) String() string
type Pronunciation ¶
type Pronunciation struct { // 发音质量综合得分 0-100 Score float32 `json:"score"` // 发音质量好坏 0-100 Gop float32 `json:"gop"` }
整体发音打分
func (Pronunciation) String ¶
func (o Pronunciation) String() string
type PushTranscriberJobsRequest ¶
type PushTranscriberJobsRequest struct {
Body *PostTranscriberJobs `json:"body,omitempty"`
}
Request Object
func (PushTranscriberJobsRequest) String ¶
func (o PushTranscriberJobsRequest) String() string
type PushTranscriberJobsResponse ¶
type PushTranscriberJobsResponse struct { // 创建的任务标识, 如果创建任务成功时必须存在。 JobId *string `json:"job_id,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (PushTranscriberJobsResponse) String ¶
func (o PushTranscriberJobsResponse) String() string
type PutUpdateVocabReq ¶
type PutUpdateVocabReq struct { // 热词表名,不可重复。内容限制为字母,数字,下中划线和井号,长度不超过32字节。 Name string `json:"name"` // 热词表描述,长度不超过255字节。 Description *string `json:"description,omitempty"` // 热词表语言类型。 language取值范围: chinese_mandarin 汉语普通话 Language PutUpdateVocabReqLanguage `json:"language"` // 支持中英混编热词,单个热词只能由英文字母和unicode编码的汉字组成,不能有其他符号,包括空格。 单词库支持热词数上限1024。 单个热词长度上限32字节。 Contents []string `json:"contents"` }
func (PutUpdateVocabReq) String ¶
func (o PutUpdateVocabReq) String() string
type PutUpdateVocabReqLanguage ¶
type PutUpdateVocabReqLanguage struct {
// contains filtered or unexported fields
}
func (PutUpdateVocabReqLanguage) MarshalJSON ¶
func (c PutUpdateVocabReqLanguage) MarshalJSON() ([]byte, error)
func (*PutUpdateVocabReqLanguage) UnmarshalJSON ¶
func (c *PutUpdateVocabReqLanguage) UnmarshalJSON(b []byte) error
func (PutUpdateVocabReqLanguage) Value ¶ added in v0.0.90
func (c PutUpdateVocabReqLanguage) Value() string
type PutUpdateVocabReqLanguageEnum ¶
type PutUpdateVocabReqLanguageEnum struct {
CHINESE_MANDARIN PutUpdateVocabReqLanguage
}
func GetPutUpdateVocabReqLanguageEnum ¶
func GetPutUpdateVocabReqLanguageEnum() PutUpdateVocabReqLanguageEnum
type RecognizeFlashAsrRequest ¶
type RecognizeFlashAsrRequest struct { // 所使用的模型特征串。通常是 “语种_采样率_领域”的形式。 采样率需要与音频采样率保持一致。 当前支持如下模型特征串: chinese_8k_common chinese_16k_conversation Property RecognizeFlashAsrRequestProperty `json:"property"` // 音频格式,audio_format取值范围: wav,mp3,m4a,aac,opus AudioFormat RecognizeFlashAsrRequestAudioFormat `json:"audio_format"` // 是否加标点, 可以为 yes, 默认no AddPunc *RecognizeFlashAsrRequestAddPunc `json:"add_punc,omitempty"` // 是否将音频中的数字使用阿拉伯数字的形式呈现,取值为yes,no,默认为yes DigitNorm *RecognizeFlashAsrRequestDigitNorm `json:"digit_norm,omitempty"` // 表示是否在识别结果中输出分词结果信息,取值为yes,no,默认no NeedWordInfo *RecognizeFlashAsrRequestNeedWordInfo `json:"need_word_info,omitempty"` // 热词表id VocabularyId *string `json:"vocabulary_id,omitempty"` // obs桶名 ObsBucketName *string `json:"obs_bucket_name,omitempty"` // obs对象key,经过urlencode编码,长度不超过1024个字符 ObsObjectKey *string `json:"obs_object_key,omitempty"` // 表示是否在识别中只识别首个声道的音频数据,取值为“yes”和“no”,默认为“no”。 FirstChannelOnly *RecognizeFlashAsrRequestFirstChannelOnly `json:"first_channel_only,omitempty"` }
Request Object
func (RecognizeFlashAsrRequest) String ¶
func (o RecognizeFlashAsrRequest) String() string
type RecognizeFlashAsrRequestAddPunc ¶
type RecognizeFlashAsrRequestAddPunc struct {
// contains filtered or unexported fields
}
func (RecognizeFlashAsrRequestAddPunc) MarshalJSON ¶
func (c RecognizeFlashAsrRequestAddPunc) MarshalJSON() ([]byte, error)
func (*RecognizeFlashAsrRequestAddPunc) UnmarshalJSON ¶
func (c *RecognizeFlashAsrRequestAddPunc) UnmarshalJSON(b []byte) error
func (RecognizeFlashAsrRequestAddPunc) Value ¶ added in v0.0.90
func (c RecognizeFlashAsrRequestAddPunc) Value() string
type RecognizeFlashAsrRequestAddPuncEnum ¶
type RecognizeFlashAsrRequestAddPuncEnum struct { YES RecognizeFlashAsrRequestAddPunc NO RecognizeFlashAsrRequestAddPunc }
func GetRecognizeFlashAsrRequestAddPuncEnum ¶
func GetRecognizeFlashAsrRequestAddPuncEnum() RecognizeFlashAsrRequestAddPuncEnum
type RecognizeFlashAsrRequestAudioFormat ¶
type RecognizeFlashAsrRequestAudioFormat struct {
// contains filtered or unexported fields
}
func (RecognizeFlashAsrRequestAudioFormat) MarshalJSON ¶
func (c RecognizeFlashAsrRequestAudioFormat) MarshalJSON() ([]byte, error)
func (*RecognizeFlashAsrRequestAudioFormat) UnmarshalJSON ¶
func (c *RecognizeFlashAsrRequestAudioFormat) UnmarshalJSON(b []byte) error
func (RecognizeFlashAsrRequestAudioFormat) Value ¶ added in v0.0.90
func (c RecognizeFlashAsrRequestAudioFormat) Value() string
type RecognizeFlashAsrRequestAudioFormatEnum ¶
type RecognizeFlashAsrRequestAudioFormatEnum struct { WAV RecognizeFlashAsrRequestAudioFormat MP3 RecognizeFlashAsrRequestAudioFormat M4A RecognizeFlashAsrRequestAudioFormat AAC RecognizeFlashAsrRequestAudioFormat OPUS RecognizeFlashAsrRequestAudioFormat }
func GetRecognizeFlashAsrRequestAudioFormatEnum ¶
func GetRecognizeFlashAsrRequestAudioFormatEnum() RecognizeFlashAsrRequestAudioFormatEnum
type RecognizeFlashAsrRequestDigitNorm ¶
type RecognizeFlashAsrRequestDigitNorm struct {
// contains filtered or unexported fields
}
func (RecognizeFlashAsrRequestDigitNorm) MarshalJSON ¶
func (c RecognizeFlashAsrRequestDigitNorm) MarshalJSON() ([]byte, error)
func (*RecognizeFlashAsrRequestDigitNorm) UnmarshalJSON ¶
func (c *RecognizeFlashAsrRequestDigitNorm) UnmarshalJSON(b []byte) error
func (RecognizeFlashAsrRequestDigitNorm) Value ¶ added in v0.0.90
func (c RecognizeFlashAsrRequestDigitNorm) Value() string
type RecognizeFlashAsrRequestDigitNormEnum ¶
type RecognizeFlashAsrRequestDigitNormEnum struct { YES RecognizeFlashAsrRequestDigitNorm NO RecognizeFlashAsrRequestDigitNorm }
func GetRecognizeFlashAsrRequestDigitNormEnum ¶
func GetRecognizeFlashAsrRequestDigitNormEnum() RecognizeFlashAsrRequestDigitNormEnum
type RecognizeFlashAsrRequestFirstChannelOnly ¶
type RecognizeFlashAsrRequestFirstChannelOnly struct {
// contains filtered or unexported fields
}
func (RecognizeFlashAsrRequestFirstChannelOnly) MarshalJSON ¶
func (c RecognizeFlashAsrRequestFirstChannelOnly) MarshalJSON() ([]byte, error)
func (*RecognizeFlashAsrRequestFirstChannelOnly) UnmarshalJSON ¶
func (c *RecognizeFlashAsrRequestFirstChannelOnly) UnmarshalJSON(b []byte) error
func (RecognizeFlashAsrRequestFirstChannelOnly) Value ¶ added in v0.0.90
func (c RecognizeFlashAsrRequestFirstChannelOnly) Value() string
type RecognizeFlashAsrRequestFirstChannelOnlyEnum ¶
type RecognizeFlashAsrRequestFirstChannelOnlyEnum struct { YES RecognizeFlashAsrRequestFirstChannelOnly NO RecognizeFlashAsrRequestFirstChannelOnly }
func GetRecognizeFlashAsrRequestFirstChannelOnlyEnum ¶
func GetRecognizeFlashAsrRequestFirstChannelOnlyEnum() RecognizeFlashAsrRequestFirstChannelOnlyEnum
type RecognizeFlashAsrRequestNeedWordInfo ¶
type RecognizeFlashAsrRequestNeedWordInfo struct {
// contains filtered or unexported fields
}
func (RecognizeFlashAsrRequestNeedWordInfo) MarshalJSON ¶
func (c RecognizeFlashAsrRequestNeedWordInfo) MarshalJSON() ([]byte, error)
func (*RecognizeFlashAsrRequestNeedWordInfo) UnmarshalJSON ¶
func (c *RecognizeFlashAsrRequestNeedWordInfo) UnmarshalJSON(b []byte) error
func (RecognizeFlashAsrRequestNeedWordInfo) Value ¶ added in v0.0.90
func (c RecognizeFlashAsrRequestNeedWordInfo) Value() string
type RecognizeFlashAsrRequestNeedWordInfoEnum ¶
type RecognizeFlashAsrRequestNeedWordInfoEnum struct { YES RecognizeFlashAsrRequestNeedWordInfo NO RecognizeFlashAsrRequestNeedWordInfo }
func GetRecognizeFlashAsrRequestNeedWordInfoEnum ¶
func GetRecognizeFlashAsrRequestNeedWordInfoEnum() RecognizeFlashAsrRequestNeedWordInfoEnum
type RecognizeFlashAsrRequestProperty ¶
type RecognizeFlashAsrRequestProperty struct {
// contains filtered or unexported fields
}
func (RecognizeFlashAsrRequestProperty) MarshalJSON ¶
func (c RecognizeFlashAsrRequestProperty) MarshalJSON() ([]byte, error)
func (*RecognizeFlashAsrRequestProperty) UnmarshalJSON ¶
func (c *RecognizeFlashAsrRequestProperty) UnmarshalJSON(b []byte) error
func (RecognizeFlashAsrRequestProperty) Value ¶ added in v0.0.90
func (c RecognizeFlashAsrRequestProperty) Value() string
type RecognizeFlashAsrRequestPropertyEnum ¶
type RecognizeFlashAsrRequestPropertyEnum struct { CHINESE_8K_COMMON RecognizeFlashAsrRequestProperty CHINESE_16K_CONVERSATION RecognizeFlashAsrRequestProperty }
func GetRecognizeFlashAsrRequestPropertyEnum ¶
func GetRecognizeFlashAsrRequestPropertyEnum() RecognizeFlashAsrRequestPropertyEnum
type RecognizeFlashAsrResponse ¶
type RecognizeFlashAsrResponse struct { // 服务内部的令牌,可用于在日志中追溯具体调用流程 TraceId *string `json:"trace_id,omitempty"` // 音频时长 AudioDuration *int32 `json:"audio_duration,omitempty"` // 识别结果 FlashResult *[]FlashResult `json:"flash_result,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (RecognizeFlashAsrResponse) String ¶
func (o RecognizeFlashAsrResponse) String() string
type RecognizeShortAudioRequest ¶
type RecognizeShortAudioRequest struct {
Body *PostShortAudioReq `json:"body,omitempty"`
}
Request Object
func (RecognizeShortAudioRequest) String ¶
func (o RecognizeShortAudioRequest) String() string
type RecognizeShortAudioResponse ¶
type RecognizeShortAudioResponse struct { // 服务内部的令牌,可用于在日志中追溯具体流程,调用失败无此字段。 在某些错误情况下可能没有此令牌字符串。 TraceId *string `json:"trace_id,omitempty"` Result *Result `json:"result,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (RecognizeShortAudioResponse) String ¶
func (o RecognizeShortAudioResponse) String() string
type Result ¶
type RunAudioAssessmentRequest ¶
type RunAudioAssessmentRequest struct {
Body *PostShortAudioAssessmentReq `json:"body,omitempty"`
}
Request Object
func (RunAudioAssessmentRequest) String ¶
func (o RunAudioAssessmentRequest) String() string
type RunAudioAssessmentResponse ¶
type RunAudioAssessmentResponse struct { // 综合评分,0-100 Score *float32 `json:"score,omitempty"` // 完整性评分,0-100 表示有多少比例的单词发音是清楚的 Completeness *float32 `json:"completeness,omitempty"` // 音频/视频时长,单位秒 Duration *float32 `json:"duration,omitempty"` Pronunciation *Pronunciation `json:"pronunciation,omitempty"` Fluency *Fluency `json:"fluency,omitempty"` // 单词评测打分表 Words *[]Word `json:"words,omitempty"` // 评测失败时定位问题使用的字段 TraceId *string `json:"traceId,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (RunAudioAssessmentResponse) String ¶
func (o RunAudioAssessmentResponse) String() string
type RunMultiModalAssessmentRequest ¶
type RunMultiModalAssessmentRequest struct {
Body *PostMultiModalAssessmentReq `json:"body,omitempty"`
}
Request Object
func (RunMultiModalAssessmentRequest) String ¶
func (o RunMultiModalAssessmentRequest) String() string
type RunMultiModalAssessmentResponse ¶
type RunMultiModalAssessmentResponse struct { // 综合评分,0-100 Score *float32 `json:"score,omitempty"` // 完整性评分,0-100 表示有多少比例的单词发音是清楚的 Completeness *float32 `json:"completeness,omitempty"` // 音频/视频时长,单位秒 Duration *float32 `json:"duration,omitempty"` Pronunciation *Pronunciation `json:"pronunciation,omitempty"` Fluency *Fluency `json:"fluency,omitempty"` // 单词评测打分表 Words *[]Word `json:"words,omitempty"` // 评测失败时定位问题使用的字段 TraceId *string `json:"traceId,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (RunMultiModalAssessmentResponse) String ¶
func (o RunMultiModalAssessmentResponse) String() string
type RunTtsRequest ¶
type RunTtsRequest struct {
Body *PostCustomTtsReq `json:"body,omitempty"`
}
Request Object
func (RunTtsRequest) String ¶
func (o RunTtsRequest) String() string
type RunTtsResponse ¶
type RunTtsResponse struct { // 服务内部的令牌,可用于在日志中追溯具体流程。 在某些错误情况下可能没有此令牌字符串。 TraceId *string `json:"trace_id,omitempty"` Result *CustomResult `json:"result,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (RunTtsResponse) String ¶
func (o RunTtsResponse) String() string
type Segment ¶
type Segment struct { // 一句的起始时间戳,单位ms。 StartTime int32 `json:"start_time"` // 一句的结束时间戳,单位ms。 EndTime int32 `json:"end_time"` Result *TranscriberResult `json:"result"` }
type Sentences ¶
type Sentences struct { // 分句结果信息 EndTime *int32 `json:"end_time,omitempty"` Result *FlashScoreResult `json:"result,omitempty"` // 一句话开始时间,单位毫秒 StartTime *int32 `json:"start_time,omitempty"` }
type ShowVocabulariesParams ¶
type ShowVocabulariesParams struct { // 热词表的表名,用于筛选热词表表名。 Name *string `json:"name,omitempty"` }
func (ShowVocabulariesParams) String ¶
func (o ShowVocabulariesParams) String() string
type ShowVocabulariesRequest ¶
type ShowVocabulariesRequest struct {
Body *ShowVocabulariesParams `json:"body,omitempty"`
}
Request Object
func (ShowVocabulariesRequest) String ¶
func (o ShowVocabulariesRequest) String() string
type ShowVocabulariesResponse ¶
type ShowVocabulariesResponse struct { // 热词表数。 Count *int32 `json:"count,omitempty"` // 调用成功返回热词表列表,调用失败时无此字段。 Result *[]VocabInfo `json:"result,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (ShowVocabulariesResponse) String ¶
func (o ShowVocabulariesResponse) String() string
type ShowVocabularyRequest ¶
type ShowVocabularyRequest struct { // 热词表id。 VocabularyId string `json:"vocabulary_id"` }
Request Object
func (ShowVocabularyRequest) String ¶
func (o ShowVocabularyRequest) String() string
type ShowVocabularyResponse ¶
type ShowVocabularyResponse struct { // 调用成功返回热词表ID,调用失败时无此字段。 VocabularyId *string `json:"vocabulary_id,omitempty"` // 调用成功返回热词表名,调用失败时无此字段。 Name *string `json:"name,omitempty"` // 调用成功返回热词表描述,调用失败时无此字段。 Description *string `json:"description,omitempty"` // 调用成功返回热词表语言类型,调用失败时无此字段。 Language *ShowVocabularyResponseLanguage `json:"language,omitempty"` // 调用成功返回热词列表,调用失败时无此字段。 Contents *[]string `json:"contents,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (ShowVocabularyResponse) String ¶
func (o ShowVocabularyResponse) String() string
type ShowVocabularyResponseLanguage ¶
type ShowVocabularyResponseLanguage struct {
// contains filtered or unexported fields
}
func (ShowVocabularyResponseLanguage) MarshalJSON ¶
func (c ShowVocabularyResponseLanguage) MarshalJSON() ([]byte, error)
func (*ShowVocabularyResponseLanguage) UnmarshalJSON ¶
func (c *ShowVocabularyResponseLanguage) UnmarshalJSON(b []byte) error
func (ShowVocabularyResponseLanguage) Value ¶ added in v0.0.90
func (c ShowVocabularyResponseLanguage) Value() string
type ShowVocabularyResponseLanguageEnum ¶
type ShowVocabularyResponseLanguageEnum struct { CHINESE_MANDARIN ShowVocabularyResponseLanguage ENGLISH ShowVocabularyResponseLanguage }
func GetShowVocabularyResponseLanguageEnum ¶
func GetShowVocabularyResponseLanguageEnum() ShowVocabularyResponseLanguageEnum
type TranscriberConfig ¶
type TranscriberConfig struct { // 支持语音的格式。 audioformat取值范围: auto 自动判断,系统会自动判断并支持WAV(内部支持pcm/ulaw/alaw/adpcm编码格式)、MP3、M4A、ogg-speex、ogg-opus、AMR、wma等格式,相应的文件后缀名为.wav, .mp3, .m4a, .spx, .opus, .amr 和.wma, 不区分大小写。支持双声道的音频。 pcm16k16bit 16k16bit裸音频录音数据。 pcm8k16bit 8k16bit裸音频录音数据。 ulaw16k8bit 16k8bit ulaw 裸音频录音数据。 ulaw8k8bit 8k8bit ulaw 裸音频录音数据。 alaw16k8bit 16k8bit alaw 裸音频录音数据。 alaw8k8bit 8k8bit alaw 裸音频录音数据。 vox8k4bit 8k4bit vox 裸音频录音数据。 v3_8k4bit 8k4bit v3 裸音频录音数据。 AudioFormat *TranscriberConfigAudioFormat `json:"audio_format,omitempty"` // 所使用的模型特征串。通常是“语种_采样率_领域”的形式,例如chinese_8k_common。 采样率需要与音频采样率保持一致。 当前支持如下模型特征串: chinese_16k_media (音视频领域,区域仅支持cn-north-4,cn-east-3) chinese_8k_common chinese_16k_conversation chinese_8k_bank(银行领域,区域仅支持cn-north-4) chinese_8k_insurance(保险领域,区域仅支持cn-north-4) sichuan_8k_common (四川话识别,区域支持cn-north-4,cn-east-3) Property TranscriberConfigProperty `json:"property"` // 是否加标点, 可以为 yes, no(缺省)。 AddPunc *TranscriberConfigAddPunc `json:"add_punc,omitempty"` NeedAnalysisInfo *AnalysisInfo `json:"need_analysis_info,omitempty"` // 热词表id,不使用则不填写。 VocabularyId *string `json:"vocabulary_id,omitempty"` // 表示是否将语音中的数字识别为阿拉伯数字,取值为yes 、 no,缺省为yes。 DigitNorm *TranscriberConfigDigitNorm `json:"digit_norm,omitempty"` // 用于录音文件识表示回调 url,即用户用于接收识别结果的服务器地址,不支持IP地址方式调用,url长度小于2048字节。服务请求方法为POST。 如果用户使用回调方式获取识别结果,需填写该参数,处理成功后用户服务器需返回状态码“200”。 如果用户使用轮询方式获取识别结果,则无需填写该参数。别结果的回调url,不使用则不填写。 CallbackUrl *string `json:"callback_url,omitempty"` // 表示是否在识别结果中输出分词结果信息,取值为“yes”和“no”,默认为“no”。 NeedWordInfo *TranscriberConfigNeedWordInfo `json:"need_word_info,omitempty"` }
func (TranscriberConfig) String ¶
func (o TranscriberConfig) String() string
type TranscriberConfigAddPunc ¶
type TranscriberConfigAddPunc struct {
// contains filtered or unexported fields
}
func (TranscriberConfigAddPunc) MarshalJSON ¶
func (c TranscriberConfigAddPunc) MarshalJSON() ([]byte, error)
func (*TranscriberConfigAddPunc) UnmarshalJSON ¶
func (c *TranscriberConfigAddPunc) UnmarshalJSON(b []byte) error
func (TranscriberConfigAddPunc) Value ¶ added in v0.0.90
func (c TranscriberConfigAddPunc) Value() string
type TranscriberConfigAddPuncEnum ¶
type TranscriberConfigAddPuncEnum struct { YES TranscriberConfigAddPunc NO TranscriberConfigAddPunc }
func GetTranscriberConfigAddPuncEnum ¶
func GetTranscriberConfigAddPuncEnum() TranscriberConfigAddPuncEnum
type TranscriberConfigAudioFormat ¶
type TranscriberConfigAudioFormat struct {
// contains filtered or unexported fields
}
func (TranscriberConfigAudioFormat) MarshalJSON ¶
func (c TranscriberConfigAudioFormat) MarshalJSON() ([]byte, error)
func (*TranscriberConfigAudioFormat) UnmarshalJSON ¶
func (c *TranscriberConfigAudioFormat) UnmarshalJSON(b []byte) error
func (TranscriberConfigAudioFormat) Value ¶ added in v0.0.90
func (c TranscriberConfigAudioFormat) Value() string
type TranscriberConfigAudioFormatEnum ¶
type TranscriberConfigAudioFormatEnum struct { AUTO TranscriberConfigAudioFormat PCM16K16BIT TranscriberConfigAudioFormat PCM8K16BIT TranscriberConfigAudioFormat ULAW16K8BIT TranscriberConfigAudioFormat ULAW8K8BIT TranscriberConfigAudioFormat ALAW16K8BIT TranscriberConfigAudioFormat ALAW8K8BIT TranscriberConfigAudioFormat VOX8K4BIT TranscriberConfigAudioFormat V3_8K4BIT TranscriberConfigAudioFormat }
func GetTranscriberConfigAudioFormatEnum ¶
func GetTranscriberConfigAudioFormatEnum() TranscriberConfigAudioFormatEnum
type TranscriberConfigDigitNorm ¶
type TranscriberConfigDigitNorm struct {
// contains filtered or unexported fields
}
func (TranscriberConfigDigitNorm) MarshalJSON ¶
func (c TranscriberConfigDigitNorm) MarshalJSON() ([]byte, error)
func (*TranscriberConfigDigitNorm) UnmarshalJSON ¶
func (c *TranscriberConfigDigitNorm) UnmarshalJSON(b []byte) error
func (TranscriberConfigDigitNorm) Value ¶ added in v0.0.90
func (c TranscriberConfigDigitNorm) Value() string
type TranscriberConfigDigitNormEnum ¶
type TranscriberConfigDigitNormEnum struct { YES TranscriberConfigDigitNorm NO TranscriberConfigDigitNorm }
func GetTranscriberConfigDigitNormEnum ¶
func GetTranscriberConfigDigitNormEnum() TranscriberConfigDigitNormEnum
type TranscriberConfigNeedWordInfo ¶
type TranscriberConfigNeedWordInfo struct {
// contains filtered or unexported fields
}
func (TranscriberConfigNeedWordInfo) MarshalJSON ¶
func (c TranscriberConfigNeedWordInfo) MarshalJSON() ([]byte, error)
func (*TranscriberConfigNeedWordInfo) UnmarshalJSON ¶
func (c *TranscriberConfigNeedWordInfo) UnmarshalJSON(b []byte) error
func (TranscriberConfigNeedWordInfo) Value ¶ added in v0.0.90
func (c TranscriberConfigNeedWordInfo) Value() string
type TranscriberConfigNeedWordInfoEnum ¶
type TranscriberConfigNeedWordInfoEnum struct { YES TranscriberConfigNeedWordInfo NO TranscriberConfigNeedWordInfo }
func GetTranscriberConfigNeedWordInfoEnum ¶
func GetTranscriberConfigNeedWordInfoEnum() TranscriberConfigNeedWordInfoEnum
type TranscriberConfigProperty ¶
type TranscriberConfigProperty struct {
// contains filtered or unexported fields
}
func (TranscriberConfigProperty) MarshalJSON ¶
func (c TranscriberConfigProperty) MarshalJSON() ([]byte, error)
func (*TranscriberConfigProperty) UnmarshalJSON ¶
func (c *TranscriberConfigProperty) UnmarshalJSON(b []byte) error
func (TranscriberConfigProperty) Value ¶ added in v0.0.90
func (c TranscriberConfigProperty) Value() string
type TranscriberConfigPropertyEnum ¶
type TranscriberConfigPropertyEnum struct { CHINESE_16K_MEDIA TranscriberConfigProperty CHINESE_8K_COMMON TranscriberConfigProperty CHINESE_16K_CONVERSATION TranscriberConfigProperty CHINESE_8K_BANK TranscriberConfigProperty CHINESE_8K_INSURANCE TranscriberConfigProperty SICHUAN_8K_COMMON TranscriberConfigProperty }
func GetTranscriberConfigPropertyEnum ¶
func GetTranscriberConfigPropertyEnum() TranscriberConfigPropertyEnum
type TranscriberResult ¶
type TranscriberResult struct { // 识别结果文本。 Text string `json:"text"` AnalysisInfo *AnalysisInfoResult `json:"analysis_info,omitempty"` // 分词输出列表 WordInfo *[]WordInfo `json:"word_info,omitempty"` }
func (TranscriberResult) String ¶
func (o TranscriberResult) String() string
type TtsConfig ¶
type TtsConfig struct { // 语音格式头:wav、mp3、pcm。 默认:wav AudioFormat *TtsConfigAudioFormat `json:"audio_format,omitempty"` // 采样率:16000、8000 默认:8000 SampleRate *TtsConfigSampleRate `json:"sample_rate,omitempty"` // 语音合成特征字符串,组成形式为{language}_{speaker}_{domain},即“语种_人员标识_领域”。发音人分为普通发音人和精品发音人。 普通发音人每100字计一次调用,取值范围如下: chinese_xiaoqi_common 小琪,标准女声发音人。 chinese_xiaoyu_common 小宇,标准男声发音人。 chinese_xiaoyan_common 小燕,温柔女声发音人。 chinese_xiaowang_common 小王,童声发音人。 chinese_xiaowen_common 小雯,柔美女声发音人。 chinese_xiaojing_common 小婧,俏皮女声发音人。 chinese_xiaosong_common 小宋,激昂男声发音人。 chinese_xiaoxia_common 小夏,热情女声发音人。 chinese_xiaodai_common 小呆,呆萌童声发音人。 chinese_xiaoqian_common 小倩,成熟女声发音人。 english_cameal_common cameal,柔美女声英文发音人。 精品发音人每50字计一次调用,区域仅支持cn-north-4,cn-east-3,暂时不支持音高调节,取值范围如下: chinese_huaxiaoxia_common 华小夏,热情女声发音人。 chinese_huaxiaogang_common 华晓刚,利落男声发音人。 chinese_huaxiaolu_common 华小璐,知性女声发音人。 chinese_huaxiaoshu_common 华小舒,舒缓女声发音人。 chinese_huaxiaowei_common 华小唯,嗲柔女声发音人。 chinese_huaxiaoliang_common 华小靓,嘹亮女声发音人。 chinese_huaxiaodong_common 华晓东,成熟男声发音人。 chinese_huaxiaoyan_common 华小颜,严厉女声发音人。 chinese_huaxiaoxuan_common 华小萱,台湾女声发音人。 chinese_huaxiaowen_common 华小雯,柔美女声发音人。 chinese_huaxiaoyang_common 华晓阳,朝气男声发音人。 chinese_huaxiaomin_common 华小闽,闽南女声发音人。 chinese_huanvxia_literature 华女侠,武侠女生发音人,只支持16k的采样率。 chinese_huaxiaoxuan_literature 华晓悬,悬疑男声发音人,只支持16k的采样率。 默认:chinese_xiaoyan_common Property *TtsConfigProperty `json:"property,omitempty"` // 语速。 取值范围:[-500,500] 默认值:0 Speed *int32 `json:"speed,omitempty"` // 音高。 取值范围: [-500,500] 默认值:0 Pitch *int32 `json:"pitch,omitempty"` // 音量。 取值范围:[0, 100] 默认值:50 Volume *int32 `json:"volume,omitempty"` }
语音合成配置数据结构。
type TtsConfigAudioFormat ¶
type TtsConfigAudioFormat struct {
// contains filtered or unexported fields
}
func (TtsConfigAudioFormat) MarshalJSON ¶
func (c TtsConfigAudioFormat) MarshalJSON() ([]byte, error)
func (*TtsConfigAudioFormat) UnmarshalJSON ¶
func (c *TtsConfigAudioFormat) UnmarshalJSON(b []byte) error
func (TtsConfigAudioFormat) Value ¶ added in v0.0.90
func (c TtsConfigAudioFormat) Value() string
type TtsConfigAudioFormatEnum ¶
type TtsConfigAudioFormatEnum struct { WAV TtsConfigAudioFormat MP3 TtsConfigAudioFormat PCM TtsConfigAudioFormat }
func GetTtsConfigAudioFormatEnum ¶
func GetTtsConfigAudioFormatEnum() TtsConfigAudioFormatEnum
type TtsConfigProperty ¶
type TtsConfigProperty struct {
// contains filtered or unexported fields
}
func (TtsConfigProperty) MarshalJSON ¶
func (c TtsConfigProperty) MarshalJSON() ([]byte, error)
func (*TtsConfigProperty) UnmarshalJSON ¶
func (c *TtsConfigProperty) UnmarshalJSON(b []byte) error
func (TtsConfigProperty) Value ¶ added in v0.0.90
func (c TtsConfigProperty) Value() string
type TtsConfigPropertyEnum ¶
type TtsConfigPropertyEnum struct { CHINESE_XIAOQI_COMMON TtsConfigProperty CHINESE_XIAOYU_COMMON TtsConfigProperty CHINESE_XIAOYAN_COMMON TtsConfigProperty CHINESE_XIAOXIA_COMMON TtsConfigProperty CHINESE_XIAODAI_COMMON TtsConfigProperty CHINESE_XIAOQIAN_COMMON TtsConfigProperty CHINESE_XIAOWANG_COMMON TtsConfigProperty CHINESE_XIAOWEN_COMMON TtsConfigProperty CHINESE_XIAOJING_COMMON TtsConfigProperty CHINESE_XIAOSONG_COMMON TtsConfigProperty ENGLISH_CAMEAL_COMMON TtsConfigProperty CHINESE_HUAXIAOXIA_COMMON TtsConfigProperty CHINESE_HUAXIAOGANG_COMMON TtsConfigProperty CHINESE_HUAXIAOLU_COMMON TtsConfigProperty CHINESE_HUAXIAOSHU_COMMON TtsConfigProperty CHINESE_HUAXIAOWEI_COMMON TtsConfigProperty CHINESE_HUAXIAOLIANG_COMMON TtsConfigProperty CHINESE_HUAXIAODONG_COMMON TtsConfigProperty CHINESE_HUAXIAOYAN_COMMON TtsConfigProperty CHINESE_HUAXIAOXUAN_COMMON TtsConfigProperty CHINESE_HUAXIAOWEN_COMMON TtsConfigProperty CHINESE_HUAXIAOYANG_COMMON TtsConfigProperty CHINESE_HUAXIAOMIN_COMMON TtsConfigProperty CHINESE_HUANVXIA_LITERATURE TtsConfigProperty CHINESE_HUAXIAOXUAN_LITERATURE TtsConfigProperty CHINESE_HUAXIAOMEI_COMMON TtsConfigProperty CHINESE_HUAXIAOFEI_COMMON TtsConfigProperty CHINESE_HUAXIAOLONG_COMMON TtsConfigProperty CHINESE_HUAXIAORUI_COMMON TtsConfigProperty }
func GetTtsConfigPropertyEnum ¶
func GetTtsConfigPropertyEnum() TtsConfigPropertyEnum
type TtsConfigSampleRate ¶
type TtsConfigSampleRate struct {
// contains filtered or unexported fields
}
func (TtsConfigSampleRate) MarshalJSON ¶
func (c TtsConfigSampleRate) MarshalJSON() ([]byte, error)
func (*TtsConfigSampleRate) UnmarshalJSON ¶
func (c *TtsConfigSampleRate) UnmarshalJSON(b []byte) error
func (TtsConfigSampleRate) Value ¶ added in v0.0.90
func (c TtsConfigSampleRate) Value() string
type TtsConfigSampleRateEnum ¶
type TtsConfigSampleRateEnum struct { E_16000 TtsConfigSampleRate E_8000 TtsConfigSampleRate }
func GetTtsConfigSampleRateEnum ¶
func GetTtsConfigSampleRateEnum() TtsConfigSampleRateEnum
type UpdateVocabularyRequest ¶
type UpdateVocabularyRequest struct { // 被更新的热词表id。 VocabularyId string `json:"vocabulary_id"` Body *PutUpdateVocabReq `json:"body,omitempty"` }
Request Object
func (UpdateVocabularyRequest) String ¶
func (o UpdateVocabularyRequest) String() string
type UpdateVocabularyResponse ¶
type UpdateVocabularyResponse struct { // 调用成功返回热词表ID,调用失败时无此字段。 VocabularyId *string `json:"vocabulary_id,omitempty"` HttpStatusCode int `json:"-"` }
Response Object
func (UpdateVocabularyResponse) String ¶
func (o UpdateVocabularyResponse) String() string
type VocabInfo ¶
type VocabInfo struct { // 热词表ID。 VocabularyId string `json:"vocabulary_id"` // 热词表名。 Name string `json:"name"` // 热词表语言类型。 Language VocabInfoLanguage `json:"language"` // 热词表描述。 Description string `json:"description"` }
type VocabInfoLanguage ¶
type VocabInfoLanguage struct {
// contains filtered or unexported fields
}
func (VocabInfoLanguage) MarshalJSON ¶
func (c VocabInfoLanguage) MarshalJSON() ([]byte, error)
func (*VocabInfoLanguage) UnmarshalJSON ¶
func (c *VocabInfoLanguage) UnmarshalJSON(b []byte) error
func (VocabInfoLanguage) Value ¶ added in v0.0.90
func (c VocabInfoLanguage) Value() string
type VocabInfoLanguageEnum ¶
type VocabInfoLanguageEnum struct { CHINESE_MANDARIN VocabInfoLanguage ENGLISH VocabInfoLanguage }
func GetVocabInfoLanguageEnum ¶
func GetVocabInfoLanguageEnum() VocabInfoLanguageEnum
type Word ¶
type Word struct { // 去除了所有标点符号后的原始文本 前端调用接口后推荐使用“text”来在UI 中展示结果 Text string `json:"text"` // 接口接收的原始文本 TextOriginal string `json:"text_original"` // 原始文本规范化后切分成的单词 如175 会 规范为 [\"one\", \"\"hundred\", \"and\", \"seventy\", \"five\"] TextNormalised []string `json:"text_normalised"` // 是否命中模型发音字典 如果未命中,则表明会根据发音规律推测正确发音 OutOfVocabulary *bool `json:"out_of_vocabulary,omitempty"` // 起始时间 StartTime *float32 `json:"start_time,omitempty"` // 结束时间 EndTime *float32 `json:"end_time,omitempty"` // 综合评分 Score *float32 `json:"score,omitempty"` Pronunciation *WordPronunciation `json:"pronunciation,omitempty"` Fluency *WordFluency `json:"fluency,omitempty"` // 音节打分表 Phonemes *[]Phoneme `json:"phonemes,omitempty"` }
单个单词的发音评测结果
type WordInfo ¶
type WordPronunciation ¶
type WordPronunciation struct { // 单词发音综合得分 0-100 Score float32 `json:"score"` // 单词发音好坏得分 0-100 Gop float32 `json:"gop"` }
单词发音打分
func (WordPronunciation) String ¶
func (o WordPronunciation) String() string
Source Files ¶
- model_analysis_info.go
- model_analysis_info_result.go
- model_audio_config.go
- model_collect_transcriber_job_request.go
- model_collect_transcriber_job_response.go
- model_config.go
- model_create_vocabulary_request.go
- model_create_vocabulary_response.go
- model_custom_result.go
- model_delete_vocabulary_request.go
- model_delete_vocabulary_response.go
- model_flash_result.go
- model_flash_score_result.go
- model_fluency.go
- model_multi_modal_config.go
- model_phoneme.go
- model_phoneme_fluency.go
- model_phoneme_pronunciation.go
- model_post_create_vocab_req.go
- model_post_custom_tts_req.go
- model_post_multi_modal_assessment_req.go
- model_post_short_audio_assessment_req.go
- model_post_short_audio_req.go
- model_post_transcriber_jobs.go
- model_pronunciation.go
- model_push_transcriber_jobs_request.go
- model_push_transcriber_jobs_response.go
- model_put_update_vocab_req.go
- model_recognize_flash_asr_request.go
- model_recognize_flash_asr_response.go
- model_recognize_short_audio_request.go
- model_recognize_short_audio_response.go
- model_result.go
- model_run_audio_assessment_request.go
- model_run_audio_assessment_response.go
- model_run_multi_modal_assessment_request.go
- model_run_multi_modal_assessment_response.go
- model_run_tts_request.go
- model_run_tts_response.go
- model_segment.go
- model_sentences.go
- model_show_vocabularies_params.go
- model_show_vocabularies_request.go
- model_show_vocabularies_response.go
- model_show_vocabulary_request.go
- model_show_vocabulary_response.go
- model_transcriber_config.go
- model_transcriber_result.go
- model_tts_config.go
- model_update_vocabulary_request.go
- model_update_vocabulary_response.go
- model_vocab_info.go
- model_word.go
- model_word_fluency.go
- model_word_info.go
- model_word_pronunciation.go
Click to show internal directories.
Click to hide internal directories.