microsoft
/

phi-1_5

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Commit History

fix(modeling_phi): Fixes cached generation when above maximum context length.

37527ba

gugarosa commited on Dec 5, 2023

Fixes exceeding maximum sequence length when using generate().

5fd430c

gugarosa commited on Nov 20, 2023

Delete modeling_mixformer_sequential.py

d212a78

gugarosa commited on Nov 16, 2023

Delete configuration_mixformer_sequential.py

8e9ebfb

gugarosa commited on Nov 16, 2023

Update to new model interface.

271c339

gugarosa commited on Nov 16, 2023

Improves type hinting on configuration arguments.

92557d0

gugarosa commited on Nov 1, 2023

Enables to toggle fused_dense, flash_rotary and attn_pdrop in the configuration.

45f4b21

gugarosa commited on Nov 1, 2023

Fixes flash-attn import with a try/except statement

0254d42

gugarosa commited on Nov 1, 2023

Adds support for flash-attn rotary embedding and fused dense layers.

0bbd68a

gugarosa commited on Nov 1, 2023

Adds support for MQA/GQA and attention mask during training.

de35f90

gugarosa commited on Oct 30, 2023

Update modeling_mixformer_sequential.py

d38e6f9

gugarosa commited on Oct 26, 2023

Adding _set_gradient_checkpointing for compatibility (#22)

8091327

vriveras commited on Oct 17, 2023

Upload modeling_mixformer_sequential.py

b6a7e2f

gugarosa commited on Sep 27, 2023

Add more precise license metadata (UI will be cleaner!) (#35)

8ab0f29

julien-c HF staff commited on Sep 27, 2023

Upload README.md

bc09a08

gugarosa commited on Sep 27, 2023

fix(phi-1_5): Checks length of `attention_mask`if it is passed as direct tensor.

f9f2ac7

gugarosa commited on Sep 26, 2023

Support for `attention_mask` in forward pass.

3128bb6

gugarosa commited on Sep 26, 2023

add _no_split_modules property (#17)

4a426d8

winglian commited on Sep 15, 2023

Update README.md

7d482dd

suriyagunasekar commited on Sep 14, 2023

Update README.md

c8f6ad8

suriyagunasekar commited on Sep 12, 2023

Link paper to arXiv (#5)

762a311

osanseviero commited on Sep 12, 2023

Update README.md

ea95720

suriyagunasekar commited on Sep 12, 2023

Update README.md

4bba51c

suriyagunasekar commited on Sep 11, 2023

Update README.md

52e294a

suriyagunasekar commited on Sep 11, 2023

Upload tokenizer

9efbcaf

suriyagunasekar commited on Sep 11, 2023

Upload MixFormerSequentialForCausalLM

d655135

suriyagunasekar commited on Sep 11, 2023

Update README.md

07a048e

suriyagunasekar commited on Sep 11, 2023

Update README.md

b630515

suriyagunasekar commited on Sep 11, 2023

Update README.md

40b496f

suriyagunasekar commited on Sep 11, 2023

Update README.md

d9c7521

suriyagunasekar commited on Sep 11, 2023

Update README.md

6ddac37

suriyagunasekar commited on Sep 11, 2023

Update README.md

cd4510c

suriyagunasekar commited on Sep 11, 2023

Update README.md

34046b0

suriyagunasekar commited on Sep 11, 2023

Update README.md

24ad69c

suriyagunasekar commited on Sep 11, 2023

Update README.md

b3d67f3

suriyagunasekar commited on Sep 11, 2023

Upload Research License.docx

14be656

suriyagunasekar commited on Sep 11, 2023

Upload tokenizer

6157c47

suriyagunasekar commited on Sep 10, 2023

Upload MixFormerSequentialForCausalLM

e656142

suriyagunasekar commited on Sep 10, 2023

Upload tokenizer

4b752e7

suriyagunasekar commited on Sep 10, 2023

Upload MixFormerSequentialForCausalLM

2bfd6ef

suriyagunasekar commited on Sep 10, 2023

Upload tokenizer

67f350b

suriyagunasekar commited on Sep 10, 2023

Upload MixFormerSequentialForCausalLM

ba44a90

suriyagunasekar commited on Sep 10, 2023

Upload tokenizer

67a43eb

suriyagunasekar commited on Sep 10, 2023

Upload MixFormerSequentialForCausalLM

1698206

suriyagunasekar commited on Sep 10, 2023

initial commit

98416e6

suriyagunasekar commited on Sep 10, 2023